ExTTNet: A Deep Learning Algorithm for Extracting Table Texts from Invoice Images

向作者提问

NEW

简介

在这项工作中，通过一个名为ExTTNet的深度学习模型，自主地获取了发票中的产品表格。首先，使用光学字符识别（OCR）技术从发票图像中获取文本。这个过程中使用了Tesseract OCR引擎[37]。然后，使用特征提取方法增加了现有特征的数量，以提高准确性。根据OCR得到的每个文本是否为表格元素进行标记。在这项研究中，使用了多层人工神经网络模型。训练是在Nvidia RTX 3090显卡上进行的，共花费了162分钟。经过训练，F1得分为0.92。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文的问题是如何自动从发票图像中提取产品表格，通过使用深度学习模型ExTTNet来解决这个问题。这是一个新问题，因为以前很少有研究自动从发票图像中提取表格。
关键思路

本论文的关键思路是使用OCR技术从发票图像中提取文本，并使用特征提取方法来增加特征数量以提高准确性，然后使用多层人工神经网络模型进行标记。这个思路相比当前领域的研究有新意，因为它使用了特征提取方法来增加特征数量，提高了准确性。
其它亮点

本论文的亮点包括使用OCR技术从发票图像中提取文本，使用特征提取方法增加特征数量，使用多层人工神经网络模型进行标记。实验使用了Nvidia RTX 3090显卡进行训练，并取得了F1分数0.92的结果。论文还提供了开源代码和数据集，这些都是值得关注的地方。这项工作值得进一步研究，以提高准确性和效率。
相关研究

最近在这个领域中，还有一些相关的研究正在进行。例如，"A Deep Learning Framework for Automatic Extraction of Tables from Invoice Documents"和"Table Extraction from Invoice Documents using Deep Learning"。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问