论文链接:https://arxiv.org/pdf/2302.05019.pdf

获取结构化的人类知识是设计高级人工智能的重要基础。为此,早期研究者做了大量工作以从不同数据源中自动提取可以提供有用信息(事实)的数据模式;进一步地,学者的研究兴趣转向自动构建概念化的结构良好的知识图谱,而非仅提供信息的数据;近年来,新的研究挑战亦开始深入多样化的复杂大数据环境中的知识工程。在上述具有历史意义的研究活动中涌现了大量具有开创性的重要知识图谱构建方法、新研究范式以及挑战。鉴于此,本综述对358篇相关文献进行了系统调研,对了知识图谱构建这一重要主题进行了详细总结。本文全面阐释了知识图谱构建的主要3个阶段,包括知识获取、知识精炼、知识演化。具体地,本文按照数据环境、设计动机与模型架构三个方向,对处理上述各阶段中子任务的方法模型进行了比较、探讨。同时,为力求综述的全面性,本文也对图谱构建前的数据预处理与知识图谱构建后存储的相关方法进行了简介。同时,本文简要回顾了重要的现有知识图谱成果(数据集)与处理知识图谱构建的各类先成工具。最后,本综述对10个具有重要现实意义的未来研究方向与挑战进行了讨论。

内容中包含的图片若涉及版权问题,请及时与我们联系删除