ExTTNet: A Deep Learning Algorithm for Extracting Table Texts from Invoice Images

2024年02月03日
  • 简介
    在这项工作中,通过一个名为ExTTNet的深度学习模型,自主地获取了发票中的产品表格。首先,使用光学字符识别(OCR)技术从发票图像中获取文本。这个过程中使用了Tesseract OCR引擎[37]。然后,使用特征提取方法增加了现有特征的数量,以提高准确性。根据OCR得到的每个文本是否为表格元素进行标记。在这项研究中,使用了多层人工神经网络模型。训练是在Nvidia RTX 3090显卡上进行的,共花费了162分钟。经过训练,F1得分为0.92。
  • 图表
  • 解决问题
    本论文的问题是如何自动从发票图像中提取产品表格,通过使用深度学习模型ExTTNet来解决这个问题。这是一个新问题,因为以前很少有研究自动从发票图像中提取表格。
  • 关键思路
    本论文的关键思路是使用OCR技术从发票图像中提取文本,并使用特征提取方法来增加特征数量以提高准确性,然后使用多层人工神经网络模型进行标记。这个思路相比当前领域的研究有新意,因为它使用了特征提取方法来增加特征数量,提高了准确性。
  • 其它亮点
    本论文的亮点包括使用OCR技术从发票图像中提取文本,使用特征提取方法增加特征数量,使用多层人工神经网络模型进行标记。实验使用了Nvidia RTX 3090显卡进行训练,并取得了F1分数0.92的结果。论文还提供了开源代码和数据集,这些都是值得关注的地方。这项工作值得进一步研究,以提高准确性和效率。
  • 相关研究
    最近在这个领域中,还有一些相关的研究正在进行。例如,"A Deep Learning Framework for Automatic Extraction of Tables from Invoice Documents"和"Table Extraction from Invoice Documents using Deep Learning"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论