Linking Named Entities in Diderot's \textit{Encyclopédie} to Wikidata

Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp. 10610--10615
2024年06月05日
  • 简介
    本文介绍了18世纪欧洲的百科全书《百科全书》和现代维基百科的异同。虽然维基百科的规模更大,但两者之间缺乏数字连接可能会阻碍对知识演变的研究和比较。维基百科的关键要素是维基数据,它为文章提供了结构化数据的图表支持。本文描述了对《百科全书》中超过10,300个条目进行注释,使我们能够将这些条目与图表相连接的过程。我们考虑了地理和人类实体。《百科全书》不包含人物传记条目,因为它们大多数出现在地点的子条目中。我们提取了所有地理条目,并完全注释了所有包含人类实体描述的条目。这代表了超过2,600个指向地点或人类实体的链接。此外,我们还注释了超过9,500个仅具有地理内容的条目。我们描述了注释过程以及应用示例。这个资源可以在https://github.com/pnugues/encyclopedie_1751上获得。
  • 作者讲解
  • 图表
  • 解决问题
    将18世纪的Diderot's Encyclopédie与当前的Wikipedia进行数字化连接,以便比较两者的知识演变。
  • 关键思路
    使用Wikidata为Encyclopédie的条目进行结构化数据标注,以便将其与Wikipedia的图形进行连接。
  • 其它亮点
    将超过10,300个Encyclopédie条目与Wikidata标识符进行注释,以便将其与图形连接。作者注释了包含地理和人类实体的条目,以及仅包含地理内容的条目。作者描述了注释过程以及应用示例。资源可在GitHub上获取。
  • 相关研究
    在这个领域中,还没有太多相关的研究。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问