论文地址:https://arxiv.org/pdf/2207.12104.pdf

开源代码:https://github.com/1170300714/w2n_wsod

摘要

弱监督目标检测(WSOD)旨在训练一个只需要图像级注释的目标检测器。最近,一些工作已经成功地从训练良好的WSOD网络中选择准确的盒来监督半监督检测框架以获得更好的性能。然而,这些方法只是根据图像级准则将训练集分为标记集和未标记集,从而选择足够多的错误标记或错误定位的盒预测作为伪基础真理,导致检测性能的次优解。为了克服这一问题,我们提出了一个新的WSOD框架,它具有从弱监督到噪声监督(W2N)的新范式。一般情况下,我们提出了一种双模块迭代训练算法,通过训练好的WSOD网络生成伪基值来精化伪标记,并逐步监督更好的目标检测器。在定位自适应模块中,我们提出了一个正则化损失来减少原始伪真值中判别部分的比例,从而获得更好的伪真值,用于进一步的训练。在半监督模块中,我们提出了一种两任务实例级拆分的方法来选择高质量的标签来训练半监督检测器。在不同基准上的实验结果验证了W2N的有效性,并且我们的W2N优于现有的所有纯WSOD方法和迁移学习方法。

主要贡献

我们进行了大量的实验和烧蚀研究来评估我们提出的方法的有效性。实验结果表明,在不同的基准数据集上,我们的W2N框架对所有基线都有很大的改进。总之,本文的贡献概括如下:

  • 提出了一种新的多阶段WSOD范式,将多阶段弱监督目标检测问题转化为带噪声标记的目标检测问题,以减少低质量伪真实的负面影响。
  • 针对带噪声标签的训练问题,提出了一种迭代学习框架,包括定位自适应模块和半监督学习模块,提高了伪真值的质量和检测器的性能。
  • 在不同基准数据集上的实验结果表明,我们提出的方法对所有WSOD基线都有很大的改善,在WSOD任务上达到了最先进的性能。

实验

在 [28,36,46] 之后,我们在四个基准上评估我们的方法:PASCAL VOC 2007、PASCAL VOC 2012 [10]、MS-COCO [22] 和 ILSVRC 2013 [7] 检测数据集。 评估指标。 我们使用平均精度 (mAP) 来评估类别的检测性能,并使用 CorLoc 来测量定位精度。

内容中包含的图片若涉及版权问题,请及时与我们联系删除