The Solution for the GAIIC2024 RGB-TIR object detection Challenge

2024年07月04日
  • 简介
    本报告从无人机的角度介绍了一种解决RGB-TIR目标检测任务的方法。与传统的目标检测方法不同,RGB-TIR目标检测旨在利用RGB和TIR图像的互补信息进行检测。从无人机的角度来看,RGB-TIR目标检测的挑战包括图像背景复杂、光照频繁变化和未校准的RGB-TIR图像对。为了解决这些挑战,我们采用了轻量级的YOLOv9模型,并扩展了多级辅助分支,增强了模型的鲁棒性,使其更适用于无人机场景中的实际应用。在RGB-TIR检测的图像融合方面,我们将融合模块并入主干网络,实现了特征级别的图像融合,隐含地解决了校准问题。我们提出的方法在A和B基准测试中分别获得了0.516和0.543的mAP得分,同时保持了所有模型中最高的推理速度。
  • 图表
  • 解决问题
    RGB-TIR目标检测在无人机视角下的挑战,包括复杂的背景、光照变化和未校准的图像对。本论文试图解决这些问题。
  • 关键思路
    本文提出了一种轻量级的YOLOv9模型,通过扩展多级辅助分支来增强模型的鲁棒性,使其更适用于无人机场景中的实际应用。同时,在模型中增加了融合模块,以在特征级别上融合RGB和TIR图像。
  • 其它亮点
    本文在A和B基准测试中分别达到了0.516和0.543的mAP得分,同时保持了所有模型中最高的推理速度。实验使用了开源数据集,并提供了开源代码。本文的方法可以进一步研究和应用于无人机视角下的目标检测等领域。
  • 相关研究
    最近的相关研究包括:《基于深度学习的多模态图像融合目标检测》、《RGB-T图像目标检测方法综述》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论