标题:腾讯|Efficient Decoder-free Object Detection with Transformers(使用变换器实现高效的无解码器对象检测)
作者:Peixian Chen, Mengdan Zhang, Chunhua Shen等
简介:本文介绍了一种视觉对象检测方法。微妙的用法是DETR系列,在物体检测中无需许多手工设计的组件,但引入了解码器需要超长的时间才能收敛。作者提出了一种新型的无解码器完全基于变换器(DFFT)物体检测器,在两次训练中都实现了高效率和推理阶段。作者将异议检测简化为仅基于编码器的单级锚点密集预测问题,方法是将两个问题作为中心入口点:1)消除训练效率低下的解码器,并利用两个强大的编码器来保持单级特征图预测的准确性;2)探索检测任务的低级语义特征计算资源。特别是,作者设计了一个新颖的以轻量化检测为导向的变换器主干网,通过丰富的语义有效地捕获低级特征。对 MS COCO 基准测试的广泛实验表明:DFFT比DETR高出 2.5%,计算成本降低了28%,训练时间减少了10倍。与当前最佳的基于锚点的探测器RetinaNet算法相比,DFFT获得了超过5.5%的AP增益,同时降低70%的计算成本。
论文下载:https://arxiv.org/pdf/2206.06829v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢