- 简介尽管计算机视觉领域取得了显著的进展,但精确检测微小物体仍然是一个重大挑战,这主要是由于图像数据中这些物体被分配的微小像素表示。在地球科学和遥感领域,微小物体的高保真检测可以促进从城市规划到环境监测等各种应用。在本文中,我们提出了一个新的框架,即DeNoising FPN with Trans R-CNN(DNTR),以提高微小物体检测的性能。DNTR由一个易于插入的设计DeNoising FPN(DN-FPN)和一个有效的基于Transformer的检测器Trans R-CNN组成。具体而言,特征金字塔网络中的特征融合对于检测多尺度物体非常重要。但是,由于不同尺度的特征之间没有正则化,因此在融合过程中可能会产生噪声特征。因此,我们引入了一个DN-FPN模块,利用对比学习来抑制FPN自顶向下路径中每个级别的特征中的噪声。其次,基于两阶段框架,我们用一种新颖的Trans R-CNN检测器替换了过时的R-CNN检测器,以便专注于具有自我关注的微小物体的表示。实验结果表明,我们的DNTR在AI-TOD数据集上的APvt至少比基线提高了17.4%,在VisDrone数据集上的AP至少提高了9.6%。我们的代码将在https://github.com/hoiliu-0801/DNTR上提供。
- 图表
- 解决问题提高遥感图像中微小目标检测的准确性,解决由于像素表示不足而导致的挑战。
- 关键思路提出了一种新的框架DNTR,包括DeNoising FPN和Trans R-CNN两个模块。其中,DN-FPN模块利用对比学习抑制FPN中不同尺度特征之间的噪声,Trans R-CNN模块则使用自注意力机制,提高小目标的表示能力。
- 其它亮点实验结果表明,DNTR在AI-TOD和VisDrone数据集上的表现均优于基线模型,APvt提高了至少17.4%,AP提高了9.6%。作者提供了代码。
- 最近的相关研究包括:YOLOv4、EfficientDet、CornerNet-Lite等。
沙发等你来抢
去评论
评论
沙发等你来抢