- 简介我们介绍了MathWriting,它是目前最大的在线手写数学表达式数据集。它包含23万个人工编写的样本和额外的40万个合成样本。MathWriting也可以用于离线手写数学表达式识别,并且比所有现有的离线手写数学表达式数据集(例如IM2LATEX-100K)都要大。我们基于MathWriting数据引入了一个基准,以促进在线和离线手写数学表达式识别的研究。
- 图表
- 解决问题本论文旨在解决手写数学表达式识别(HME)的问题,提出了一个包含23万人工写作样本和40万合成样本的数据集MathWriting,并基于该数据集提出了一个基准测试,以推进在线和离线HME识别的研究。
- 关键思路本论文的关键思路是通过构建一个大规模的、多样化的手写数学表达式数据集MathWriting,以及基于该数据集的基准测试,来推进在线和离线HME识别的研究。相比当前的研究,本论文的思路在于提供了一个更大、更多样的数据集,并且提出了一个基准测试,可以更客观地评估HME识别算法的性能。
- 其它亮点本论文的亮点在于提出了一个包含23万人工写作样本和40万合成样本的数据集MathWriting,并基于该数据集提出了一个基准测试,以推进在线和离线HME识别的研究。论文还介绍了一些HME识别的相关工作和算法,并对比了它们在MathWriting数据集上的表现。此外,论文还探讨了MathWriting数据集的一些特点,如样本的多样性、难度等,并提出了一些未来的研究方向,如如何进一步提高HME识别的准确率和速度。
- 最近在这个领域中,还有一些相关的研究被进行。例如,IM2LATEX-100K是一个包含10万个手写数学表达式的数据集,它也被用于离线HME识别的研究。此外,还有一些研究关注于在线HME识别,如Handwriting Recognition in the Wild (HWR)等。
沙发等你来抢
去评论
评论
沙发等你来抢