本文简要介绍谷歌团队在CVPR2022上录用论文“Towards End-to-End Unified Scene Text Detection and Layout Analysis”的主要工作。该论文提出一个基于Object Query建模的端到端网络,可以同时进行场景文字检测和版面分析任务,并且提出了一个具有层次化标注的数据集HierText,数据集已开源。
论文地址: https://arxiv.org/abs/2203.15143
内容中包含的图片若涉及版权问题,请及时与我们联系删除
举报类型(必选)
举报详情(选填)
0/200
沙发等你来抢
评论
沙发等你来抢