- 简介近年来,应用图机器学习(GML)进行节点/图分类和链接预测取得了显著的成功。然而,边缘分类任务在社交网络分析和网络安全等许多实际应用中都有广泛的应用,但却没有看到重大进展。为了解决这一问题,我们的研究首创了一种全面的边缘分类方法。我们发现了一种新的“拓扑不平衡问题”,它源于不同类别之间边的分布不均,影响每个边的局部子图,从而损害了边缘分类的性能。受到最近关于节点分类的研究表明,性能差异存在于不同的局部结构模式中的启发,我们旨在调查在拓扑不平衡的边缘分类中,通过表征局部类别分布方差是否也可以缓解性能差异。为了克服这一挑战,我们引入了拓扑熵(TE),一种新颖的基于拓扑的度量,用于测量每个边的拓扑不平衡性。我们的实证研究证实,TE有效地测量了局部类别分布方差,并表明优先考虑TE值高的边可以帮助解决拓扑不平衡问题。基于此,我们开发了两种策略——拓扑重加权和基于TE楔形的Mixup——以根据TE集中训练(合成)边缘。虽然拓扑重加权直接根据TE操纵训练边缘权重,但我们基于楔形的Mixup在高TE楔形之间插值合成边缘。最终,我们将这些策略集成到一种新的边缘分类拓扑不平衡策略中:TopoEdge。通过广泛的实验,我们证明了我们提出的策略在新的策划数据集上的有效性,并因此建立了(不平衡)边缘分类的新基准。
-
- 图表
- 解决问题本篇论文试图解决边分类中的拓扑失衡问题,提出了一种基于拓扑熵的方法来解决这个问题。
- 关键思路本文提出了拓扑熵(TE)来度量每条边的拓扑失衡程度,并且开发了两种策略:拓扑重加权和基于TE的Wedge Mixup,以便更好地训练边分类模型。
- 其它亮点本文提出的TE方法可以有效地度量本地类分布方差,可以通过优先考虑高TE值的边来解决拓扑失衡问题。本文还开发了两种策略:拓扑重加权和基于TE的Wedge Mixup,以便更好地训练边分类模型。实验结果表明,TopoEdge可以有效地解决拓扑失衡问题,同时在新的数据集上建立了新的基准。
- 最近的相关研究包括:"Graph Convolutional Networks for Web-Scale Recommender Systems"和"Graph Attention Networks"等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流