异构图在工业界的诸多场景有着广泛的应用,随着图神经网络的兴起,许多异构图神经网络也如雨后春笋般涌现出来。然而由于缺乏有效的基准数据集,很多工作难以公平比较。今年 KDD上,来自清华、微软、阿里、中科院、宾大等单位的合作者共同推出 Heterogenous Graph Benchmark(HGB)和强基线方法 Simple-HGN,希望可以推动该领域更快更健康地发展。

文章链接:

http://keg.cs.tsinghua.edu.cn/jietang/publications/KDD21-Lv-et-al-HeterGNN.pdf

代码下载地址:

https://github.com/THUDM/HGB

数据下载地址:

https://www.biendata.xyz/hgb/#/datasets

HGB 收集了在 3 个任务上共收集了 11 个中等规模异构图数据集,三个任务分别是节点分类、链接预测、基于知识图谱的推荐,相关数据集的统计信息如图所示:

研究者将消融实验中发现的最简单有效的两种手段:异构信息注意力和隐含层 L2 正则化加到经典同构方法 GAT 上,并且加入了来自于 NLP 模型 Realformer 的注意力残差机制,成功设计了一种在 HGB 上表现超过之前所有模型的强大新基线 Simple-HGN(下图):

内容中包含的图片若涉及版权问题,请及时与我们联系删除