SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection

2024年07月01日
  • 简介
    半监督目标检测(SSOD)利用未标记的数据来提高目标检测器,最近成为热门话题。然而,现有的SSOD方法主要集中在水平物体上,而忽略了空中图像中常见的多向物体。同时,多向物体的注释成本显著高于它们的水平对应物。因此,在本文中,我们提出了一种简单而有效的半监督定向目标检测方法,称为SOOD++。具体而言,我们观察到空中图像中的物体通常具有任意方向、小尺度和聚合,这启发了以下核心设计:使用简单的实例感知密集采样(SIDS)策略生成全面的密集伪标签;几何感知自适应加权(GAW)损失通过利用空中物体的复杂几何信息动态调节每对伪标签和对应预测之间的重要性;我们将空中图像视为全局布局,并通过提出的噪声驱动全局一致性(NGC)显式构建伪标签和预测集之间的多对多关系。在各种多向物体数据集下进行的广泛实验表明了我们方法的有效性。例如,在DOTA-V1.5基准测试中,该方法在单尺度训练和测试时大幅优于以前的最先进技术(SOTA)(在10%、20%和30%标记数据设置下,分别为+2.92、+2.39和+2.57 mAP),更重要的是,它仍然优于使用完整的DOTA-V1.5训练集训练的强监督基线,该基线的70.66 mAP,提高了+1.82 mAP,得到了72.48 mAP,推动了新的最先进技术。代码将会公开发布。
  • 图表
  • 解决问题
    本文旨在提出一种简单而有效的半监督定向目标检测方法,用于多方向目标的航空图像中,解决目前半监督目标检测主要集中在水平目标上的问题。同时,该方法还试图降低多方向目标的注释成本。
  • 关键思路
    本文提出了三个核心设计:使用简单的实例感知密集采样策略生成全面的密集伪标签;利用航空目标的复杂几何信息动态调节每个伪标签与相应预测之间的重要性的几何感知自适应加权损失;通过提出的噪声驱动全局一致性(NGC),将航空图像视为全局布局,并明确构建伪标签和预测之间的多对多关系。
  • 其它亮点
    实验结果表明,该方法在各种多方向目标数据集的各种标记设置下均表现出良好的效果。例如,在DOTA-V1.5基准测试中,该方法在单尺度训练和测试的情况下,相对于10%、20%和30%标记数据设置,优于之前的最先进技术(SOTA)很大的幅度(分别为+2.92、+2.39和+2.57 mAP)。更重要的是,它仍然优于使用完整的DOTA-V1.5 train-val集训练的强有力监督基线,后者为70.66 mAP,提高了+1.82 mAP,达到了72.48 mAP,推动了新的最先进技术。该代码将会公开。
  • 相关研究
    相关研究包括:1. F. Yang等人的“SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects”;2. Y. Zhang等人的“Orientation-Aware Object Detection with Hierarchical Point-Edge Interaction Learning”;3. Y. Zhang等人的“Scale-Transferrable Object Detection”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论