知识图谱推理一直是关注的热点之一。以往大多研究单跳知识图谱推理,而对于多跳知识图谱推理仅限于小规模,无法可扩展。斯坦福大学Jure Leskovec团队最近发布SMORE通用知识图谱推理框架,实现了在海量Freebase KG知识图谱推理,包含86M节点和338M边,比之前考虑的多跳推理的最大KG大约1500倍。

论文链接:https://arxiv.org/abs/2110.14890
摘要
知识图谱(KGs)以头-关系-尾三元组的形式捕捉知识,是许多人工智能系统的关键组成部分。关于知识图谱的推理有两个重要的任务:(1) 单跳知识图谱补全,即预测知识图谱中的个体链接;(2) 多跳推理,目标是预测哪些KG实体满足给定的逻辑查询。基于嵌入的方法解决了这两个任务,首先计算每个实体和关系的嵌入,然后使用它们来形成预测。然而,现有的可扩展的KG嵌入框架仅支持单跳知识图谱完成,不能应用于更具挑战性的多跳推理任务。在这里,我们提出了可扩展的多跳推理(SMORE),第一个单跳和多跳推理的KGs通用框架。SMORE的运行性能的关键是一种新的双向拒绝采样,实现了在线训练数据生成复杂性的平方根降低。此外,SMORE利用异步调度、基于重叠CPU的数据采样、基于GPU的嵌入计算和频繁的CPU-GPU IO。与之前的多跳KG框架相比,SMORE增加了2.2倍的吞吐量(即训练速度),且对GPU内存的需求最小(2GB用于在86m节点Freebase上训练400维嵌入),并实现了GPU数量的近似线性加速。此外,在更简单的单跳知识图谱完成任务上,SMORE在单GPU和多GPU设置上都达到了与最先进的框架相当甚至更好的运行时性能。

内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢