Sparse R-CNN
是最近的一种强目标检测Baseline
,通过对稀疏的、可学习的proposal boxes
和proposal features
进行集合预测。在这项工作中提出了2个动态设计来改进Sparse R-CNN
。
首先,Sparse R-CNN
采用一对一标签分配
方案,其中匈牙利算法对每个Ground truth
只匹配一个正样本。这种一对一标签分配
对于学习到的proposal boxes
和Ground truth
之间的匹配可能不是最佳的。为了解决这一问题,作者提出了基于最优传输算法的动态标签分配
(DLA),在Sparse R-CNN
的迭代训练阶段分配递增的正样本。随着后续阶段产生精度更高的精细化proposal boxes
,在后续阶段对匹配进行约束,使其逐渐松散。
其次,在Sparse R-CNN
的推理过程中,对于不同的图像,学习到的proposal boxes
和proposal features
保持固定。在动态卷积的驱动下提出了Dynamic Proposal Generation
(DPG)来动态组合多个Proposal Experts
,为连续的训练阶段提供更好的初始proposal boxes
和proposal features
。因此,DPG
可以导出与样本相关的proposal boxes
和proposal features
来进行判断。
实验表明,Dynamic Sparse R-CNN
可以增强具有不同Backbone
的强Sparse R-CNN
Baseline
。特别是,Dynamic Sparse R-CNN
在COCO 2017验证集上达到了最先进的47.2% AP,在相同的ResNet-50
Baseline
下比Sparse R-CNN
高出2.2% AP。
论文链接:
https://arxiv.org/abs/2205.02101
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢