- 简介不确定性采样是一种主动学习策略,旨在通过迭代获取具有最高不确定性的数据点的标签,提高机器学习模型的数据效率。虽然它已被证明对独立数据有效,但其在图形上的适用性尚未得到充分探索。我们提出了第一次对节点分类的不确定性采样进行广泛研究:(1)我们对不确定性采样进行了基准测试,超越了预测不确定性,并强调了与其他主动学习策略之间的显着性能差距。(2)我们根据数据生成过程开发了基于真实情况的贝叶斯不确定性估计方法,并证明了它们在引导不确定性采样向最佳查询方向上的有效性。我们在合成数据上确认了我们的结果,并设计了一种近似方法,在真实数据集上始终优于其他不确定性估计器。(3)基于这种分析,我们将建模不确定性的缺陷与现有方法联系起来。我们的分析使得在图形上开发有原则的不确定性估计成为可能并得到了指导。
-
- 图表
- 解决问题本论文旨在探索在图数据上应用主动学习策略Uncertainty Sampling进行节点分类的有效性,并提出了一种基于贝叶斯不确定性估计的方法。
- 关键思路论文提出了一种基于贝叶斯不确定性估计的方法来指导Uncertainty Sampling选择最优的数据点进行标签获取,并在合成数据和真实数据集上进行了实验验证。
- 其它亮点论文通过实验对比发现,相比其他主动学习策略,Uncertainty Sampling在预测不确定性方面存在显著的性能差距。论文提出的基于贝叶斯不确定性估计的方法在真实数据集上表现优异,并设计了一种近似方法来提高估计的效率。论文还分析了当前不确定性建模中存在的问题,并提出了解决方案。
- 近年来,关于图数据上的主动学习策略的研究逐渐增多。例如,Sener等人提出了一种基于图卷积神经网络的主动学习方法(Active Learning with Graph Convolutional Networks),Liu等人则提出了一种基于最大化信息增益的主动学习策略(Active Learning for Node Classification via Maximizing Mutual Information)。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流