- 简介在这项工作中,通过一个名为ExTTNet的深度学习模型,自主地获取了发票中的产品表格。首先,使用光学字符识别(OCR)技术从发票图像中获取文本。这个过程中使用了Tesseract OCR引擎[37]。然后,使用特征提取方法增加了现有特征的数量,以提高准确性。根据OCR得到的每个文本是否为表格元素进行标记。在这项研究中,使用了多层人工神经网络模型。训练是在Nvidia RTX 3090显卡上进行的,共花费了162分钟。经过训练,F1得分为0.92。
- 图表
- 解决问题本论文的问题是如何自动从发票图像中提取产品表格,通过使用深度学习模型ExTTNet来解决这个问题。这是一个新问题,因为以前很少有研究自动从发票图像中提取表格。
- 关键思路本论文的关键思路是使用OCR技术从发票图像中提取文本,并使用特征提取方法来增加特征数量以提高准确性,然后使用多层人工神经网络模型进行标记。这个思路相比当前领域的研究有新意,因为它使用了特征提取方法来增加特征数量,提高了准确性。
- 其它亮点本论文的亮点包括使用OCR技术从发票图像中提取文本,使用特征提取方法增加特征数量,使用多层人工神经网络模型进行标记。实验使用了Nvidia RTX 3090显卡进行训练,并取得了F1分数0.92的结果。论文还提供了开源代码和数据集,这些都是值得关注的地方。这项工作值得进一步研究,以提高准确性和效率。
- 最近在这个领域中,还有一些相关的研究正在进行。例如,"A Deep Learning Framework for Automatic Extraction of Tables from Invoice Documents"和"Table Extraction from Invoice Documents using Deep Learning"。
沙发等你来抢
去评论
评论
沙发等你来抢