Start from Zero: Triple Set Prediction for Automatic Knowledge Graph Completion

2024年06月26日
  • 简介
    知识图谱(KG)完成旨在找出KG中缺失的三元组。已经提出了一些任务,例如链接预测和实例完成,用于KG完成。它们是三元组级别的任务,其中一些元素在缺失三元组中被给定,以预测三元组的缺失元素。然而,提前知道缺失三元组中的一些元素并不总是现实设置。在本文中,我们提出了一种新颖的图级自动KG完成任务,称为三元组集合预测(TSP),它假设没有给定缺失三元组中的任何元素。TSP是预测给定已知三元组集合的一组缺失三元组。为了适当和准确地评估这个新任务,我们提出了4个评估指标,包括3个分类指标和1个排名指标,考虑到部分开放世界和封闭世界的假设。此外,为了解决预测巨大候选三元组的问题,我们提出了一种新颖高效的基于子图的方法GPHT,可以快速预测三元组集合。为了公平地比较TSP结果,我们还提出了两种类型的方法RuleTensor-TSP和KGE-TSP,将现有的基于规则和嵌入的方法应用于TSP作为基线。在实验中,我们根据我们提出的关系相似性部分开放世界假设从Wikidata中提取了两个数据集,并创建了一个完整的家庭数据集来评估TSP结果,结果证明这些方法可以成功生成一组缺失三元组,并在新任务上取得合理的分数,GPHT的预测时间显著缩短,优于基线。实验的数据集和代码可在https://github.com/zjukg/GPHT-for-TSP上获得。
  • 作者讲解
  • 图表
  • 解决问题
    论文提出了一个新的图级别自动知识图谱补全任务Triple Set Prediction(TSP),旨在预测一组缺失的三元组,而不是预测单个三元组中的缺失元素。该任务的目的是解决当前三元组级别的知识图谱补全任务中对缺失元素的假设不现实的问题。
  • 关键思路
    论文提出了一种新的子图方法GPHT来预测缺失的三元组集合,该方法在处理大量候选三元组时具有高效性能。该方法的性能优于现有的基于规则和嵌入的方法。
  • 其它亮点
    论文提出了一个新的图级别自动知识图谱补全任务Triple Set Prediction(TSP),并提出了四个评估指标来评估该任务的性能。论文还提出了一种高效的子图方法GPHT来预测缺失的三元组集合,并将其与基于规则和嵌入的方法进行了比较。实验结果表明,该方法在TSP任务上表现出良好的性能和高效性。数据集和代码已在GitHub上开源。
  • 相关研究
    在最近的研究中,一些基于规则和嵌入的方法已被提出来解决知识图谱补全问题,如TransE、DistMult和ComplEx。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问