- 简介文本行检测是历史文献分析中的一个关键任务,面临着任意形状的文本行、密集的文本和高长宽比文本行等多种挑战。本文提出了一个通用的历史文献文本检测框架(SegHist),使得现有的基于分割的文本检测方法能够有效地解决这些挑战,特别是高长宽比的文本行。将SegHist框架与常用的DB++方法相结合,我们开发了DB-SegHist。该方法在CHDAC、MTHv2数据集上实现了SOTA,在HDRC数据集上取得了竞争性结果,其中在最具挑战性的CHDAC数据集上取得了1.19%的显著提升,该数据集具有更多高长宽比的文本行。此外,我们的方法在旋转的MTHv2和旋转的HDRC上实现了SOTA,展示了其旋转鲁棒性。代码可在https://github.com/LumionHXJ/SegHist上获得。
-
- 图表
- 解决问题本文旨在解决历史文献中的文本线检测问题,特别是高宽比文本线的检测问题。
- 关键思路本文提出了一个通用的历史文献文本检测框架SegHist,使得现有的基于分割的文本检测方法能够有效地解决这些挑战。通过将SegHist框架与常用的DB++方法相结合,提出了DB-SegHist方法,该方法在CHDAC、MTHv2数据集上实现了SOTA,并在HDRC数据集上取得了竞争性结果。
- 其它亮点本文的实验设计合理,使用了多个数据集进行验证,并且开源了代码。DB-SegHist方法在最具挑战性的CHDAC数据集上取得了1.19%的显著改善,并且在旋转的MTHv2和HDRC数据集上实现了SOTA。
- 最近的相关研究包括:《A Baseline for Historical Document Text Detection and Recognition》、《Text Line Segmentation in Historical Documents Using Convolutional Neural Networks》、《Robust Text Line Segmentation of Historical Manuscripts with Fully Convolutional Networks》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流