- 简介动态文本属性图(DyTAGs)在各种实际场景中广泛存在,其中每个节点和边缘都与文本描述相关联,且图形结构和文本描述都随时间演变。尽管它们具有广泛的适用性,但缺乏针对DyTAG的基准数据集,这阻碍了许多研究领域的潜在发展。为了解决这个问题,我们介绍了动态文本属性图基准(DTGB),这是一个包含大规模、不同领域的时间演变图形的集合,其节点和边缘通过动态变化的文本属性和类别进行丰富。为了方便使用DTGB,我们设计了基于四个实际用例的标准化评估程序:未来链接预测、目标节点检索、边缘分类和文本关系生成。这些任务要求模型理解动态图结构和自然语言,突显了DyTAGs所面临的独特挑战。此外,我们在DTGB上进行了广泛的基准实验,评估了7种流行的动态图学习算法及其适应LLM嵌入的文本属性的变体,以及6种强大的大型语言模型(LLMs)。我们的结果显示现有模型在处理DyTAGs方面的局限性。我们的分析还证明了DTGB在研究结构和文本动态性的融合方面的实用性。所提出的DTGB促进了DyTAGs及其广泛应用的研究。它为评估和推进处理动态图结构和自然语言之间相互作用的模型提供了全面的基准。该数据集和源代码可在https://github.com/zjs123/DTGB上获得。
- 图表
- 解决问题本论文旨在解决动态文本属性图(DyTAG)领域中缺乏基准数据集的问题,提出了Dynamic Text-attributed Graph Benchmark (DTGB)数据集,并设计了四个真实场景的标准化评估流程。
- 关键思路DTGB数据集是一个大规模的、时变的图数据集,节点和边都与动态变化的文本属性和类别相关联。论文还提出了基于LLM嵌入的7种常用动态图学习算法和它们在适应文本属性方面的变体,以及6个强大的大型语言模型(LLMs)的评估结果,证明了现有模型在处理DyTAGs方面的局限性。
- 其它亮点DTGB数据集的设计和标准化评估流程为DyTAGs领域的研究提供了全面的基准,并且开源了数据集和源代码。实验结果表明,现有模型在处理DyTAGs方面存在一定局限性。值得深入研究的方向包括如何更好地结合动态图结构和自然语言信息。
- 最近相关研究包括《Dynamic Graph Representation Learning: A Survey》、《A Comprehensive Survey on Graph Neural Networks》等。
沙发等你来抢
去评论
评论
沙发等你来抢