Cardinality Estimation on Hyper-relational Knowledge Graphs

2024年05月24日
  • 简介
    Cardinality Estimation (CE) 是用于查询的估计结果数量的方法,无需执行查询,是查询优化中的有效索引。最近,CE 已经在由三元组事实组成的知识图谱(KGs)上取得了巨大成功。为了更精确地表示事实,当前研究者提出了超关系型 KGs(HKGs)来表示带有限定词的三元组事实,其中限定词提供了事实的附加上下文。然而,由于 HKGs 中限定词的复杂性,现有的 KGs 上的 CE 方法在 HKGs 上的表现不尽如人意。此外,目前只有一个用于 HKG 查询基数估计的数据集,即 WD50K-QE,这不够全面,只涵盖了有限的模式。HKG 查询集的缺乏也成为全面研究 HKGs 上的 CE 问题的瓶颈。在这项工作中,我们首先构建了三个流行 HKGs 的多样化和无偏差的超关系查询集,以研究 CE。此外,我们还提出了一种新颖的限定词附加图神经网络(GNN)模型,有效地结合了限定词信息,并自适应地组合了多个 GNN 层的输出,以准确预测基数。我们的实验表明,所提出的超关系查询编码器在多样化和无偏差的基准测试中优于所有最先进的 CE 方法。
  • 图表
  • 解决问题
    本论文旨在解决超关系知识图谱中查询基数估计问题,特别是考虑到超关系知识图谱中的限定词复杂性。此外,现有的数据集不够全面,查询集也不够丰富,因此需要构建更多的数据集和查询集。
  • 关键思路
    本文提出了一种新的限定词附加图神经网络模型,可以有效地结合限定词信息并自适应地组合多个图神经网络层的输出,从而准确地预测基数。此外,还构建了多样化和公正的超关系查询集,用于评估模型的性能。
  • 其它亮点
    本文的亮点包括构建了多样化和公正的超关系查询集,提出了新的限定词附加图神经网络模型并在三个流行的超关系知识图谱上进行了实验。实验结果表明,该模型在这些数据集上的表现优于现有的基数估计方法。此外,论文还提供了开源代码。
  • 相关研究
    近年来,关于知识图谱中查询基数估计的研究越来越多。例如,基于图卷积网络的方法、基于元路径的方法等等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论