Active Generalized Category Discovery

2024年03月07日
  • 简介
    广义类别发现(GCD)是一个实用且具有挑战性的开放世界任务,旨在聚类来自新旧类别的未标记样本,利用一些旧类别的标记数据。鉴于从旧类别学习的知识并不能完全转移到新类别,而且新类别完全没有标签,GCD本质上面临着棘手的问题,包括不平衡的分类性能和旧类别与新类别之间的不一致置信度,特别是在低标记情况下。因此,需要对新类别进行一些注释。然而,标注新类别的成本非常高。为了解决这个问题,我们借鉴主动学习的精神,提出了一种新的设置,称为主动广义类别发现(AGCD)。目标是通过从神谕中主动选择有价值的少量样本进行标注,从而提高GCD的性能。为了解决这个问题,我们设计了一种自适应采样策略,联合考虑新奇性、信息量和多样性,以自适应地选择具有适当不确定性的新样本。然而,由于新类别的聚类引起标签索引的不同排序,所以查询的标签不能直接应用于后续的训练。为了解决这个问题,我们进一步提出了一种稳定的标签映射算法,将地面真实标签转换为分类器的标签空间,从而确保在不同的主动选择阶段具有一致的训练。我们的方法在通用和细粒度数据集上实现了最先进的性能。我们的代码可在https://github.com/mashijie1028/ActiveGCD上获得。
  • 图表
  • 解决问题
    论文试图解决AGCD问题,即在GCD的基础上,通过主动选择有价值的样本进行标注,以提高分类性能。
  • 关键思路
    论文提出了一种自适应采样策略,同时考虑新颖性、信息量和多样性,以选择具有适当不确定性的新样本。此外,还提出了一种稳定的标签映射算法,将标签转换为分类器的标签空间,从而确保在不同的主动选择阶段进行一致的训练。
  • 其它亮点
    论文在通用和细粒度数据集上实现了最先进的性能。代码已经开源。
  • 相关研究
    在这个领域,最近的相关研究包括《Learning to Learn from Noisy Labeled Data》、《Active Learning from Peers》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论