论文标题:Efficient DETR: Improving End-to-End Object Detector with Dense Prior 论文链接:https://arxiv.org/abs/2104.01318 作者单位:旷视科技

表现SOTA!性能优于Deformable DETR、ATSS、FCOS等网络,特别是拥挤场景中的目标检测(如行人),性能超强!

最近提出的端到端Transformer检测器,例如DETR和Deformable DETR,具有层叠6个解码器层的级联结构,以迭代地更新对象查询,否则它们的性能将严重下降。在本文中,我们调研了object containers的随机初始化(包括对象查询和参考点)主要负责多次迭代的需求。根据我们的发现,我们提出了Efficient DETR,这是一种用于端到端对象检测的简单有效的pipeline。通过同时使用密集检测和稀疏集合检测,Efficient DETR在初始化对象容器之前利用了密集检测,从而带来了1解码器结构和6解码器结构的差距。在MS COCO上进行的实验表明,我们的方法只有3个编码器层和1个解码器层,可以通过最先进的目标检测方法获得具有竞争力的性能。高效的DETR在拥挤的场景中也很强大。它在很大程度上超越了CrowdHuman数据集上的现代检测器。

内容中包含的图片若涉及版权问题,请及时与我们联系删除