【论文标题】Implicit Feature Pyramid Network for Object Detection 【作者团队】Tiancai Wang,Xiangyu Zhang,Jian Sun 【发表时间】2020/12/25 【机构】旷视科技 【论文链接】https://arxiv.org/pdf/2012.13563.pdf

【推荐理由】 本文来自旷视科技,由智源研究员孙剑及智源青年科学家张祥雨团队完成,该工作受到了北京智源人工智能研究院的支持。作者利用隐式函数建模特征金字塔特征的网络变换,相较于传统的将跨尺度特征堆叠起来的特征金字塔网络进一步引入了更多的非线性分量和跨尺度连接,在 MS COCO 上取得了较大的 mAP 性能提升。

在本文中,作者提出了一种隐式的特征金字塔网络(i-FPN)。现有的特征金字塔网络会将跨尺度模块堆叠起来,从而获得较大的感受野。本文作者提出使用最近在深度均衡模型(DEQ)引入的隐式函数来建模特征金字塔网络的变换。此外,作者还研发了一种残差式的迭代方法来高效地更新隐藏状态。作者在 MS COCO 数据上进行的实验结果表明,与使用 ResNet-50-FPN 的对比基线相比,i-FPN 有效地提升了目标检测性能(相较于 RetinaNet、Faster-RCNN、FCOS、ATSS 和 AutoAssign 分别在 mAP 指标上提升了 3.4、3.2、3.5、4.2、3.2)。

图 1:带有隐式特征金字塔网络的目标检测图示意图。

具体而言,作者将在 ImageNet 上预训练的 ResNet 用作主干网络,从而生成主干特征。初始金字塔特征和主干特征一起被初始化为零,输入到隐式 FPN 中。在隐式 FPN 中,作者利用非线性变换 G_θ 构造隐函数,然后利用均衡特征求解器求解隐函数的不动点(即均衡特征金字塔)。然后将均衡特征金字塔注入检测头,生成最终的检测预测。

本文的主要贡献为: (1)提出了一种用于目标检测的隐式特征金字塔网络。与前向堆叠跨尺度模块的显式 FPN 不同,i-FPN 直接基于固定点迭代生成了全局感受野的均衡特征。 (2)提出了一种被称为残差式迭代的循环机制,它被用来高效地更新特征金字塔的隐藏状态。此外,作者通过引入更多的非线性分量和有效的跨尺度连接很好地构建了非线性变换。

内容中包含的图片若涉及版权问题,请及时与我们联系删除