- 简介甲骨文是世界上现存最古老的文字之一。然而,由于时代久远,很多甲骨文都无法破译,使得它成为了当今古文字学领域的全球性挑战之一。本文介绍了一种新颖的方法,即Puzzle Pieces Picker(P$^3$),通过基本部首重构来解密这些神秘的文字。我们将甲骨文分解成基础笔画和部首,然后采用Transformer模型将它们重构成现代汉字,为古代文字分析提供了一个开创性的解决方案。为了进一步推进这一研究,我们开发了一个新的古汉字拼图数据集(ACCP),其中包含了七个关键历史阶段的大量字符图像,并注释了详细的部首序列。实验展示了很多有希望的发现,突显了我们的方法在解密古代汉字方面的潜力和有效性。通过这一新的数据集和方法,我们旨在弥合传统语言学和现代文献分析技术之间的鸿沟,为中华语言文化遗产的丰富历史提供新的视角。
- 图表
- 解决问题该论文旨在通过基本笔画和偏旁部首的重构,采用Transformer模型将甲骨文重构为现代汉字,以解密这些谜一般的字符。同时,论文还开发了一个新的古汉字拼图数据集,以促进古代汉字分析的研究。
- 关键思路论文的关键思路是将甲骨文分解为基本笔画和偏旁部首,然后使用Transformer模型将其重构为现代汉字。这种基于重构的方法在古代汉字分析领域中是一种创新。
- 其它亮点论文开发了一个新的古汉字拼图数据集,其中包含了七个关键历史阶段的字符图像,并注释了详细的偏旁部首序列。实验结果表明,该方法在解密古代汉字方面具有潜力和有效性。
- 在这个领域中,一些相关的研究包括:1.《基于深度学习的古汉字自动识别方法研究》;2.《基于卷积神经网络的古汉字识别方法研究》;3.《古代汉字自动识别技术研究综述》等。
沙发等你来抢
去评论
评论
沙发等你来抢