论文标题:Topology-Imbalance Learning for Semi-Supervised Node Classification

论文链接:https://arxiv.org/abs/2110.04099

代码链接:https://github.com/victorchen96/renode

作者单位:微信AI & 北京大学

研究动机

类别不均衡(Class Imbalance)是真实场景中非常常见的问题,受到了学界和业界非常多的关注。一般在我们提及类别不均衡时,默认指的是数量不均衡:即不同类中训练样本数量的不一致带来的模型于不同类别学习能力的差异,由此引起的一个严重问题是模型的决策边界会主要由数量多的类来决定 [1]。 

但是在图结构中,不同类别的训练样本不仅有在数量上的差异,也有在位置结构上的差异。这就使得图上的类别不均衡问题有了一个独特的来源:拓扑不均衡。而目前学界缺乏对于拓扑不均衡相关问题的研究。这个工作最主要的动机就是研究拓扑不均衡的特点,危害以及解决方法,希望能够引起社区对拓扑不均衡问题的重视。

 图1 拓扑不均衡问题与ReNode方法

方法效果如何

在三个不同的场景中验证了 ReNode 方法的有效性:

1. 拓扑不均衡,数量均衡、

▲ 表1 拓扑不均衡-数量均衡设定下实验结果

2. 拓扑不均衡,数量不均衡

▲ 表2 拓扑不均衡,数量不均衡下的实验结果

3. 超大图场景

▲ 图4 超大图上的实验结果

内容中包含的图片若涉及版权问题,请及时与我们联系删除