- 简介现有的异构图神经网络算法(HGNNs)大多依赖于元路径来捕捉异构图中所包含的丰富语义信息,但是这些HGNNs大多关注不同的特征聚合方式,忽略了元路径本身的特性。本文研究了三个常用数据集中的元路径,并发现不同元路径连接的邻居数量存在巨大差异。同时,大邻居路径中包含的噪声信息会对模型性能产生不利影响。因此,本文提出了一种基于大小邻居路径识别的异构图神经网络分类和聚合算法(LSPI)。LSPI通过路径鉴别器将元路径分为大邻居路径和小邻居路径,并为了减少大邻居路径中的噪声干扰问题,从拓扑和特征角度选择具有更高相似度的邻居节点,并将小邻居路径和经过过滤的大邻居路径通过不同的图卷积组件传递。对不同子图下的特征信息进行聚合,然后使用子图级别的注意力将不同子图下的特征信息融合生成最终的节点嵌入。最后,本文通过大量实验验证了该方法的优越性,并通过实验提出了大邻居路径中应该保留的节点数建议。完整可重复的代码和数据已经发布在https://github.com/liuhua811/LSPIA。
- 图表
- 解决问题本论文旨在解决现有异构图神经网络算法在捕捉异构图中富含的语义信息时,主要关注特征聚合而忽略元路径本身特性的问题。同时,该论文也试图解决大邻居路径中包含的噪声信息对模型性能的不利影响。
- 关键思路该论文提出了一种基于大和小邻居路径识别的异构图神经网络分类和聚合算法(LSPI)。LSPI首先通过路径鉴别器将元路径划分为大和小邻居路径,然后为了减少大邻居路径中的噪声干扰问题,LSPI从拓扑和特征两个角度选择具有更高相似度的邻居节点,并通过不同的图卷积组件传递小邻居路径和经过筛选的大邻居路径。最后,LSPI使用子图级别的注意力将不同子图下的特征信息融合,生成最终的节点嵌入。
- 其它亮点该论文在三个常用数据集上研究了元路径,并发现不同元路径连接的邻居数量存在巨大差异。论文提出的LSPI算法通过识别大和小邻居路径,选择相似度更高的邻居节点,有效减少了大邻居路径中的噪声干扰问题。实验结果表明,LSPI算法在节点分类任务中具有优越性能,并给出了关于保留大邻居路径节点数的建议。此外,该论文还公开了完整可重现的代码和数据,并提供了值得进一步研究的方向。
- 在最近的研究中,也有一些关于异构图神经网络的研究。例如,"HAN: Heterogeneous Graph Attention Network"和"MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding"等。
沙发等你来抢
去评论
评论
沙发等你来抢