腾讯|使用变换器实现高效的无解码器对象检测

标题：腾讯|Efficient Decoder-free Object Detection with Transformers（使用变换器实现高效的无解码器对象检测）

作者：Peixian Chen, Mengdan Zhang, Chunhua Shen等

简介：本文介绍了一种视觉对象检测方法。微妙的用法是DETR系列，在物体检测中无需许多手工设计的组件，但引入了解码器需要超长的时间才能收敛。作者提出了一种新型的无解码器完全基于变换器（DFFT）物体检测器，在两次训练中都实现了高效率和推理阶段。作者将异议检测简化为仅基于编码器的单级锚点密集预测问题，方法是将两个问题作为中心入口点：1）消除训练效率低下的解码器，并利用两个强大的编码器来保持单级特征图预测的准确性；2）探索检测任务的低级语义特征计算资源。特别是，作者设计了一个新颖的以轻量化检测为导向的变换器主干网，通过丰富的语义有效地捕获低级特征。对 MS COCO 基准测试的广泛实验表明：DFFT比DETR高出 2.5%，计算成本降低了28%，训练时间减少了10倍。与当前最佳的基于锚点的探测器RetinaNet算法相比，DFFT获得了超过5.5%的AP增益，同时降低70%的计算成本。

论文下载：https://arxiv.org/pdf/2206.06829v1.pdf

内容中包含的图片若涉及版权问题，请及时与我们联系删除

腾讯|使用变换器实现高效的无解码器对象检测

标题：腾讯|Efficient Decoder-free Object Detection with Transformers（使用变换器实现高效的无解码器对象检测）

评论列表

评论