CVPR2022 | 端到端的场景文字检测与版面分析统一框架

本文简要介绍谷歌团队在CVPR2022上录用论文“Towards End-to-End Unified Scene Text Detection and Layout Analysis”的主要工作。该论文提出一个基于Object Query建模的端到端网络，可以同时进行场景文字检测和版面分析任务，并且提出了一个具有层次化标注的数据集HierText，数据集已开源。