【论文标题】GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks 【作者团队】Tianxiang Zhao,Xiang Zhang,Suhang Wang 【发表时间】2021/03/16 【机构】宾夕法尼亚州立大学 【论文链接】https://arxiv.org/pdf/2103.08826.pdf 【推荐理由】 本文出自宾夕法尼亚州立大学,作者针对样本不平衡情况下的节点分类问题,提出了一种基于「人工少数类过采样」算法的节点分类 GNN 网络,在多个测试集上相较于对比基线有巨大的准确率提升。

节点分类是图学习中的一个重要研究课题。近年来,图神经网络(GNN)已经取得了目前最先进的节点分类性能。现有的 GNN 模型可以解决不同类节点样本平衡时的节点分类问题,然而在许多现实场景下,有些类的实例可能比其他类少得多。在这种情况下,直接训练一个 GNN 分类器就无法充分表征那些少数类的样本,导致我们无法实现最优的性能。因此,研发可以对不平衡节点进行分类的 GNN 是非常重要的。然而,这方面的工作目前还相当有限。

因此,本文作者寻求将先前用于独立同分布数据的不平衡学习技术扩展到不平衡节点分类任务,从而改进 GNN 分类器。具体而言,本文作者选用了最有效、稳定的「人工少数类过采样算法」(SMOTE)。

对于本文面对的复杂任务,之前的 SMOTE 算法不能为新合成的样本提供关系信息,而这对于图的学习是至关重要的。此外,图数据的节点属性是高维的。直接在原始输入域中进行过采样会产生域外样本,影响分类器的准确性。

为此,本文作者提出了一种新的 GraphSMOTE 框架,他们构造了一个嵌入空间来编码节点之间的相似性。他们在这个空间中合成新的样本,以确保真实性。此外,作者同时训练了一个边生成器来建模关系信息,并将这种关系信息提供给新的样本。本文提出的框架是通用的,可以很容易地扩展到不同的变体中。

图 1:模型架构示意图

内容中包含的图片若涉及版权问题,请及时与我们联系删除