SegHist: A General Segmentation-based Framework for Chinese Historical Document Text Line Detection

2024年06月17日
  • 简介
    文本行检测是历史文献分析中的一个关键任务,面临着任意形状的文本行、密集的文本和高长宽比文本行等多种挑战。本文提出了一个通用的历史文献文本检测框架(SegHist),使得现有的基于分割的文本检测方法能够有效地解决这些挑战,特别是高长宽比的文本行。将SegHist框架与常用的DB++方法相结合,我们开发了DB-SegHist。该方法在CHDAC、MTHv2数据集上实现了SOTA,在HDRC数据集上取得了竞争性结果,其中在最具挑战性的CHDAC数据集上取得了1.19%的显著提升,该数据集具有更多高长宽比的文本行。此外,我们的方法在旋转的MTHv2和旋转的HDRC上实现了SOTA,展示了其旋转鲁棒性。代码可在https://github.com/LumionHXJ/SegHist上获得。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决历史文献中的文本线检测问题,特别是高宽比文本线的检测问题。
  • 关键思路
    本文提出了一个通用的历史文献文本检测框架SegHist,使得现有的基于分割的文本检测方法能够有效地解决这些挑战。通过将SegHist框架与常用的DB++方法相结合,提出了DB-SegHist方法,该方法在CHDAC、MTHv2数据集上实现了SOTA,并在HDRC数据集上取得了竞争性结果。
  • 其它亮点
    本文的实验设计合理,使用了多个数据集进行验证,并且开源了代码。DB-SegHist方法在最具挑战性的CHDAC数据集上取得了1.19%的显著改善,并且在旋转的MTHv2和HDRC数据集上实现了SOTA。
  • 相关研究
    最近的相关研究包括:《A Baseline for Historical Document Text Detection and Recognition》、《Text Line Segmentation in Historical Documents Using Convolutional Neural Networks》、《Robust Text Line Segmentation of Historical Manuscripts with Fully Convolutional Networks》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问