SEMv3: A Fast and Robust Approach to Table Separation Line Detection

2024年05月20日
  • 简介
    表格结构识别(TSR)旨在从输入图像中解析表格的内在结构。 "分割和合并" 范式是解析表格结构的关键方法之一,其中表格分割线的检测至关重要。然而,无线和变形表格等挑战使其变得更加困难。在本文中,我们坚持 "分割和合并" 范式,并提出了 SEMv3(SEM:分割、嵌入和合并),这是一种快速且稳健的检测表格分割线的方法。在分割阶段,我们引入了关键点偏移回归(KOR)模块,通过直接回归每条线相对于其关键点提议的偏移量,有效地检测表格分割线。此外,在合并阶段,我们定义了一系列合并操作,以基于表格网格高效地描述表格结构。广泛的消融研究表明,我们提出的 KOR 模块可以快速准确地检测表格分割线。此外,在公共数据集(例如 WTW、ICDAR-2019 cTDaR Historical 和 iFLYTAB)上,SEMv3 实现了最先进的性能。代码可在 https://github.com/Chunchunwumu/SEMv3 获取。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决表格结构识别中的表格分割线检测问题,尤其是对于无线和变形的表格,如何快速准确地检测表格分割线是一个挑战。
  • 关键思路
    论文提出了一种名为SEMv3的方法,采用了“分割-嵌入-合并”范式,其中在分割阶段引入了关键点偏移回归模块(KOR),可以通过直接回归每条线相对于其关键点提案的偏移量有效地检测表格分割线。在合并阶段,论文定义了一系列基于表格网格的合并操作来有效地描述表格结构。与当前领域的研究相比,该方法既快速又鲁棒。
  • 其它亮点
    论文通过广泛的消融实验证明了其提出的KOR模块可以快速准确地检测表格分割线,并在公共数据集(如WTW、ICDAR-2019 cTDaR Historical和iFLYTAB)上实现了最先进的性能。此外,该论文提供了开源代码。
  • 相关研究
    最近的相关研究包括:《Table Structure Recognition with Transformers》、《Table Recognition with Sparse Structure Prediction Network》、《Deep Residual Networks with Adaptively Parametric Rectifier Linear Units for Table Recognition》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问