A DeNoising FPN With Transformer R-CNN for Tiny Object Detection

2024年06月09日
  • 简介
    尽管计算机视觉领域取得了显著进展,但精确检测微小物体仍然是一个重大挑战,这主要是由于图像数据中这些物体被分配的微小像素表示。这个挑战在地球科学和遥感领域中尤为深刻,因为微小物体的高保真检测可以促进从城市规划到环境监测等各种应用。在本文中,我们提出了一个新的框架,即DeNoising FPN with Trans R-CNN (DNTR),以改进微小物体检测的性能。DNTR包括一个易于插入设计的去噪FPN (DN-FPN)和一个有效的基于Transformer的检测器Trans R-CNN。具体来说,特征金字塔网络中的特征融合对于检测多尺度物体非常重要。然而,由于不同尺度特征之间没有正则化,因此在融合过程中可能会产生噪声特征。因此,我们引入了一个利用对比学习来抑制FPN自上而下路径中每个级别特征噪声的DN-FPN模块。其次,基于两阶段框架,我们用一种新颖的Trans R-CNN检测器替换了过时的R-CNN检测器,以便更好地关注微小物体的表示。实验结果表明,我们的DNTR在AI-TOD数据集的APvt指标上至少比基准表现提高了17.4%,在VisDrone数据集的AP指标上提高了9.6%。我们的代码将在https://github.com/hoiliu-0801/DNTR上提供。
  • 图表
  • 解决问题
    本文旨在解决计算机视觉领域中对微小目标精确检测的挑战,提出了一种新的框架DNTR,旨在提高微小目标检测的性能。
  • 关键思路
    DNTR框架包括DeNoising FPN(DN-FPN)和Transformer-based检测器Trans R-CNN。DN-FPN模块利用对比学习抑制FPN中不同尺度特征融合过程中产生的噪声。Trans R-CNN检测器通过自注意力机制关注微小目标的表示。
  • 其它亮点
    实验结果表明,DNTR在AI-TOD数据集上的APvt至少比基线提高了17.4%,在VisDrone数据集上的AP至少提高了9.6%。研究人员提供了开源代码。
  • 相关研究
    在微小目标检测领域的相关研究包括:M2Det,SCRDet和NAS-FPN等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论