入选《世界记忆名录》的甲骨文,是迄今为止中国发现的年代最早的成熟文字系统,对中国历史乃至世界文化的发展研究具有非凡意义。有人曾说“东周之前无信史”,因为《春秋》一书记录了2000多年前的东周历史,而之前的商文明曾被认为是传说,直至甲骨文被发现,才有力地证明了殷商王朝的存在,把中国信史向上推进了约1000年。
从甲骨文首次被发现至今,出土的甲骨实物约有十五万片。因为收藏、流转的缘故,大部分的甲骨都留下了多张拓本图像,被称为“重片”。甲骨重片数量繁多,效果互有参差,对其整理成为了一项重要的基础性研究工作,称作“校重”。然而,人工校重只能一一对照,费时费力,是甲骨文研究的一大痛点。正如《甲骨文合集补编》“前言”中所述:“这种对重、选片的工作,其烦琐、费工是局外人难以想象的。”
近期,微软亚洲研究院主管研究员武智融与首都师范大学甲骨文研究中心莫伯峰教授团队合作,提出了基于自监督学习的甲骨文校重助手 Diviner,大幅提升了甲骨文校重工作的效率。系统穷尽比对了18万幅拓本,辅助甲骨学家在上百个甲骨文数据库中发现了大量甲骨重片,不仅复现了专家过去所发现的数万组重片,而且经过初步整理,已发现了三百多组未被前人发现的校重新成果。这项研究为甲骨文整理领域开创了人工智能与人类专家协作(AI+HI)的全新研究范式。本项目全面成果的甲骨学解读稍后将发布于中国社科院先秦史研究室网站 www.xianqin.org。




“校重”是甲骨学领域的一个老题目,此前已经有很多甲骨学家为这项工作倾注了大量心血。比如甲骨文领域最重要的两部著录书《合集》《合补》,在编著过程中花费大量功夫做的工作就是校重。理论上来说,完成一张甲骨拓本的校重工作,应该将它与其余的所有甲骨拓本逐一比照,才能确保没有遗漏。尽管可以利用文字信息和分类方法缩小对比范围,但对于甲骨学家而言,这仍然是一项十分艰巨的工作,且难以保证全面性和准确性。
对比和处理海量数据,并从中挖掘有用信息正是 AI 的专长。大规模的校重,穷尽性的比对,都难不倒校重助手 Diviner。接下来就让我们一起看看 Diviner 的效果。你也可以测试一下自己能否发现其中的异同?





本次校重助手 Diviner 就提供了一批更全、更清晰的甲骨图像,更有不少堪称惊喜的新发现:
-
“重而不同”的新图像。左侧是时间较早,没有拓全的甲骨拓本。右侧是时间较晚的拓本,甲骨残破只余下一部分,尽管拓全了但很不完整。通过将两个拓本重叠,获得了一张最完整的甲骨图像,特别是右上部分的一段甲骨文字的完整展现,为甲骨文研究直接提供了一条新材料。

-
“有里有面”的新图像。有些甲骨正反两面皆有文字,但有时只有一面留下了拓本。比如马保春先生曾发现这两版反面拓本可以缀合在一起。但其中一片的正面图像一直没有找到。Diviner 校重发现了下面一片甲骨的正反完整拓本,正面缀合复原的图像也终于得以呈现。

-
从“重片”到“缀合”。左侧图像是过去由张宇卫先生缀合在一起的两片甲骨。通过 Diviner 的校重发现,下部拓本原来还有一片更完整的重片。如此,两片甲骨的缀合就扩展成了三片甲骨的缀合。

-
从模糊到清晰。由于有些甲骨拓本质量不高,上面文字难以辨认,给甲骨学家带来很多困扰。比如这几组重片,模糊拓本上的文字让人难以辨认,直到这次发现了清晰的重片,才把过去的很多疑惑解决了。






内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢