近年来,面向确定性知识图谱的嵌入模型在知识图谱补全等任务中取得了长足的进展,但是,如何设计和训练面向非确定性知识图谱的嵌入模型仍然是一个重要挑战。不同于确定性知识图谱,非确定性知识图谱的每个事实三元组都有着对应的置信度,因此,非确定性知识图谱嵌入模型需要准确地计算出每个三元组的置信度。现有的非确定性知识图谱嵌入模型结构较为简单,只能处理对称关系,并且无法很好地处理假负 (false-negative)样本问题。为了解决上述问题,我们首先提出了一个用于训练非确定性知识图谱嵌入模型的统一框架,该框架使用基于多模型的半监督学习方法训练非确定性知识图谱嵌入模型。为了解决半监督学习中半监督样本噪声过高的问题,我们还使用蒙特卡洛 Dropout 计算出模型对输出结果的不确定度,并根据该不确定度有效地过滤了半监督样本中的噪声数据。此外,为了更好地表示非确定性知识图谱中实体和关系的不确定性以处理更复杂的关系,我们还提出了基于 Beta 分布的非确定性知识图谱嵌入模型 UBetaE,该模型将实体、关系均表示为一组相互独立的 Beta 分布。在公开数据集上的实验结果表明,结合本文所提出的半监督学习方法和 UBetaE 模型,不仅极大地缓解了假负样本问题,还在多个任务中明显优于 UKGE 等当前最优的非确定性知识图谱嵌入模型。
CCKS 2021|基于Beta分布和半监督学习的非确定性知识图谱嵌入模型(徐遥, 何世柱, 刘康, 张弛, 焦飞, 赵军)
沙发等你来抢
去评论
评论
沙发等你来抢