Multi-Grained Contrast for Data-Efficient Unsupervised Representation Learning

2024年07月02日
  • 简介
    现有的对比学习方法主要集中在单粒度表示学习上,例如部件级别、物体级别或场景级别,因此不可避免地忽视了在其他粒度级别上的表示可转移性。本文旨在学习多粒度表示,这可以有效地描述图像在各种粒度级别上,从而提高广泛下游任务的泛化能力。为此,我们提出了一种新颖的多粒度对比方法(MGC)用于无监督表示学习。具体而言,我们构建了精细的多粒度正视图对应关系,然后通过这些对应关系进行多粒度对比,以学习更通用的无监督表示。 在没有预训练大规模数据集的情况下,我们的方法在包括目标检测、实例分割、场景解析、语义分割和关键点检测在内的广泛下游任务中显著优于现有的最先进方法。此外,实验结果支持我们方法的数据高效性和优秀的表示可转移性。源代码和训练的权重可在\url{https://github.com/visresearch/mgc}上获得。
  • 解决问题
    本文旨在学习多粒度表示,以有效地描述图像的各种粒度级别,从而提高广泛下游任务的泛化能力。
  • 关键思路
    本文提出了一种新颖的多粒度对比方法(MGC)进行无监督表示学习,通过构建正视图之间的精细多粒度对应关系,然后通过这些对应关系进行多粒度对比,以学习更一般的无监督表示。
  • 其它亮点
    本文方法在没有预训练大规模数据集的情况下,在包括物体检测、实例分割、场景解析、语义分割和关键点检测在内的广泛下游任务中显著优于现有的最先进方法。实验结果支持本方法的数据有效性和出色的表示传递性。此外,该方法的源代码和训练权重可在GitHub上获得。
  • 相关研究
    最近在这个领域中,还有一些相关研究,如:Contrastive Multiview Coding、SimCLR、MoCo等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论