【论文标题】LayoutParser: A Unified Toolkit for Deep Learning Based Document Image Analysis 【作者团队】Zejiang Shen, Ruochen Zhang, Melissa Dell, Benjamin Charles Germain Lee, Jacob Carlson, Weining Li 【发表时间】2021/03/29 【论文链接】https://arxiv.org/abs/2103.15348 【推荐理由】本文介绍了layoutparser,这是一个用于简化DL在文档图像分析研究和应用中的使用的开源库。 神经网络的应用主要推动了文档图像分析(DIA)的最新发展。理想情况下,研究结果可以轻松地部署到生产中,并扩展到进一步的研究中。但是,诸如松散组织的代码库和复杂的模型配置之类的各种因素使重要的创新易于被广泛的受众重用。尽管在诸如自然语言处理和计算机视觉之类的学科中,尽管人们一直在努力提高可重用性并简化深度学习(DL)模型的开发,但是它们都没有针对DIA领域的挑战进行优化。由于DIA对于社会科学和人文学科广泛领域的学术研究非常重要,因此这代表了现有工具包中的一个主要缺口。本文介绍了layoutparser,这是一个用于简化DL在DIA研究和应用中的使用的开源库。核心layoutparser库带有一组简单直观的界面,用于为布局检测,字符识别和许多其他文档处理任务应用和自定义DL模型。为了提高可扩展性,layoutparser还集成了一个社区平台,用于共享预训练的模型和完整的文档数字化管道。我们证明,layoutparser在实际用例中对轻量级和大规模数字化管道都有用。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢