- 简介尽管计算机视觉领域取得了显著进展,但精确检测微小物体仍然是一个重大挑战,这主要是由于图像数据中这些物体被分配的微小像素表示。在地球科学和遥感领域,微小物体的高保真检测可以促进从城市规划到环境监测等各种应用。在本文中,我们提出了一个新的框架,即DeNoising FPN with Trans R-CNN(DNTR),以提高微小物体检测的性能。DNTR包括易于插入的设计DeNoising FPN(DN-FPN)和有效的基于Transformer的检测器Trans R-CNN。具体而言,特征金字塔网络中的特征融合对于检测多尺度物体至关重要。然而,在不同尺度的特征之间没有正则化的情况下,在融合过程中可能会产生噪声特征。因此,我们引入了一个DN-FPN模块,利用对比学习来抑制FPN自上而下路径中每个级别的特征中的噪声。其次,基于两阶段框架,我们用一种新颖的Trans R-CNN检测器替换了过时的R-CNN检测器,以关注微小物体的自我注意力表示。实验结果表明,我们的DNTR在AI-TOD数据集的APvt方面至少比基线提高了17.4%,在VisDrone数据集的AP方面提高了9.6%。我们的代码将在此\href{https://github.com/hoiliu-0801/DNTR}{https://github.com/hoiliu-0801/DNTR}提供。
- 图表
- 解决问题提高微小目标检测的性能,尤其是在地球科学和遥感领域中应用的微小目标检测。
- 关键思路提出了一种新的框架DNTR,包括DN-FPN模块和Trans R-CNN检测器,通过对FPN中特征融合过程中的噪声进行对比学习来提高微小目标检测的性能,同时使用Transformer-based detector来聚焦于微小目标的表示。
- 其它亮点实验结果表明,在AI-TOD数据集上,DNTR的APvt至少比基线高17.4%,在VisDrone数据集上,AP至少比基线高9.6%。作者将代码开源在GitHub上。
- 最近的相关研究包括:"Tiny Object Detection Using Feature Enhancement and Attentional Modulation Networks"、"RetinaNet for Diabetic Retinopathy Detection on Eye Fundus Images"等。
沙发等你来抢
去评论
评论
沙发等你来抢