在过去,缺失数据补全任务一般有两种不同的方式解决:

  • 特征归因(feature imputation),简单地说,基于观察值估计缺失的数值,比如非负矩阵分解,SVD分解, KNN等;
  • 直接进行标签预测,也就是不管缺失值,直接预测。

但是,现有的模型(feature imputation)往往具有很强的先验假设,无法从下游任务中学习,比如上面的NMF,缺失值补全跟下游的任务几乎没有任何关系。而针对标签预测的模型通常涉及启发式算法,可能遇到可扩展的问题。

本文提出了图网络GRAPE模型,一种基于图的框架,用于特征补全和标签预测的问题。GRAPE使用图表示法来解决丢失数据问题,其中样本X和特征F被视为二部图中的节点,而观察到的特征值则作为边。

  • 论文标题:Handling Missing Data withGraph Representation LearningJiaxuan
  • 论文链接:https://arxiv.org/pdf/2010.16418.pdf
  • 论文作者: Jiaxuan You, Xiaobai Ma,Daisy Yi Ding,Mykel Kochenderfer,Jure Leskovec

在GRAPE框架下,特征补全任务被转换成了边预测的任务,而标签预测被转化为节点级预测任务,然后使用Graph Neural Network解决这些任务。在九个基准数据集上的实验结果表明,与现有的最新方法相比,GRAPE的补全任务MSE降低了20%,标签预测任务的MSE降低了10%。

本文不是解决图数据缺失问题,而是一般的数据缺失问题,这个数据一般是表格数据。数据缺失补全是传统机器学习基本任务之一,本文采用图网神经网络解决该问题,方法简单,思路新颖,非常有意思。

感兴趣的可以戳链接。

内容中包含的图片若涉及版权问题,请及时与我们联系删除