TC-OCR: TableCraft OCR for Efficient Detection & Recognition of Table Structure & Content

2024年04月16日
  • 简介
    自动识别文档图像中的表格数据是一个重大挑战,因为表格样式和结构复杂多样。表格提供了有价值的内容表达方式,增强了各种系统(如搜索引擎和知识图谱)的预测能力。传统上,解决表格检测(TD)和表格结构识别(TSR)这两个主要问题是分别进行的。在这项研究中,我们提出了一个端到端的流程,集成了DETR、CascadeTabNet和PP OCR v2等深度学习模型,实现了全面的基于图像的表格识别。这种集成方法有效地处理了多样的表格样式、复杂的结构和图像扭曲,与现有的方法(如Table Transformers)相比,提高了准确性和效率。我们的系统实现了同时进行表格检测(TD)、表格结构识别(TSR)和表格内容识别(TCR),保留了表格结构并从文档图像中准确提取表格数据。多个模型的集成解决了表格识别的复杂性,使我们的方法成为基于图像的表格理解、数据提取和信息检索应用的有前途的解决方案。我们提出的方法实现了0.96的IOU和78%的OCR准确度,相比之前的Table Transformer方法,OCR准确度提高了约25%,展示了显著的改进。
  • 图表
  • 解决问题
    本论文旨在解决文档图像中表格的自动识别问题,包括表格检测(TD)和表格结构识别(TSR),并提高表格内容识别(TCR)的准确性和效率。
  • 关键思路
    本文提出了一种端到端的方法,将深度学习模型如DETR、CascadeTabNet和PP OCR v2集成在一起,以实现全面的基于图像的表格识别。该方法有效地处理了多样化的表格样式、复杂的结构和图像扭曲,相较于现有方法如Table Transformers,取得了更高的准确性和效率。
  • 其它亮点
    本文的方法同时实现了表格检测、表格结构识别和表格内容识别,保留了表格结构并从文档图像中准确提取表格数据。实验结果表明,本文方法的IOU为0.96,OCR准确率为78%,相较于之前的Table Transformer方法,OCR准确率提高了约25%。
  • 相关研究
    最近在这个领域中,还有一些相关研究,如《Table Structure Recognition with Tensor Graph and Instance Segmentation》、《Table Recognition with Visual-Semantic Alignment Network and Its Application on Patent Analysis》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论