UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

2024年04月23日
  • 简介
    本文提出了UniMER数据集,旨在对复杂的现实场景下的数学表达式识别(MER)进行第一次研究。UniMER数据集包括一个大规模的训练集UniMER-1M,提供了前所未有的规模和多样性,包含一百万个训练实例,以及一个精心设计的测试集UniMER-Test,反映了现实场景中普遍存在的各种公式分布。因此,UniMER数据集可以训练出鲁棒性和高精度的MER模型,并进行全面的模型性能评估。此外,我们介绍了通用数学表达式识别网络(UniMERNet),这是一个创新的框架,旨在增强实际场景下的MER。UniMERNet采用长度感知模块来有效处理不同长度的公式,从而使模型能够更准确地处理复杂的数学表达式。此外,UniMERNet采用我们的UniMER-1M数据和图像增强技术,提高了模型在不同噪声条件下的鲁棒性。我们的广泛实验表明,UniMERNet优于现有的MER模型,在各种场景下设立了新的基准,并确保在实际应用中具有更优越的识别质量。数据集和模型可在https://github.com/opendatalab/UniMERNet上获取。
  • 图表
  • 解决问题
    解决问题:本论文旨在解决数学表达式识别在复杂实际场景下的问题,同时验证UniMER数据集和UniMERNet模型的有效性。
  • 关键思路
    关键思路:论文提出了UniMERNet模型,该模型通过引入长度感知模块和数据增强技术,提高了数学表达式识别的准确性和鲁棒性。
  • 其它亮点
    其他亮点:UniMER数据集包含100万个训练实例和精心设计的测试集,能够提高数学表达式识别模型的训练效果和评估结果。实验结果表明,UniMERNet模型在各种场景下均优于现有的数学表达式识别模型,并在真实应用中实现了卓越的识别质量。数据集和模型代码均已开源。
  • 相关研究
    相关研究:最近的相关研究包括“Handwritten Mathematical Expression Recognition using Convolutional Neural Networks”和“Recognition of Handwritten Mathematical Expressions: A Comparative Study”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论