论文标题:Progressive Representative Labeling for Deep Semi-Supervised Learning

论文链接:https://arxiv.org/abs/2108.06070

作者单位:商汤研究院

本文提出了一种面向半监督学习SSL的渐进式的表征标签方案,以确定要对未标记数据的哪一部分进行伪标签以及如何进行伪标签,表现SOTA!性能优于UDA、MixMatch等网络。

近年来,深度半监督学习(SSL)受到了极大的关注,利用大量未标记的数据来提高有限标记数据的深度学习的性能。伪标签(Pseudo-labeling)是扩展标注数据集的流行方法。然而,是否有更有效的标注方法仍然是一个悬而未决的问题。在本文中,我们提出仅标记最具代表性的样本以扩展标记集。通过有向 k 最近邻 (kNN) 图上相应节点的入度选择的代表性样本位于许多其他样本的 k 最近邻域中。我们设计了一个图神经网络 (GNN) 标记器,以渐进式学习方式标记它们。在渐进式 GNN 标签器的帮助下,我们的深度 SSL 方法在几个流行的 SSL 基准测试(包括 CIFAR-10、SVHN 和 ILSVRC-2012)上的表现优于最先进的方法。值得注意的是,在只有 10% 标记数据的具有挑战性的 ImageNet 基准测试中,我们实现了 72.1% 的 top-1 准确率,超过了之前的最佳结果 3.3%。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除