本文简要介绍谷歌团队在CVPR2022上录用论文“Towards End-to-End Unified Scene Text Detection and Layout Analysis”的主要工作。该论文提出一个基于Object Query建模的端到端网络,可以同时进行场景文字检测和版面分析任务,并且提出了一个具有层次化标注的数据集HierText,数据集已开源。 

内容中包含的图片若涉及版权问题,请及时与我们联系删除