Prompt Learning for Oriented Power Transmission Tower Detection in High-Resolution SAR Images

2024年04月01日
  • 简介
    从合成孔径雷达(SAR)图像中检测输电塔仍然是一项具有挑战性的任务,这是由于其相对较小的大小和侧视几何形状,以及背景杂波干扰经常阻碍了塔的识别。大量的干扰信号叠加在来自塔的回波信号上。我们发现,定位或提示输电塔的位置有助于解决这个障碍。基于这一发现,本文将提示学习引入定向物体检测器(P2Det)中,以进行多模态信息学习。P2Det包含稀疏提示编码和多模态数据之间的交叉注意力。具体而言,提出了稀疏提示编码器(SPE)来表示点位置,将提示转换为稀疏嵌入。通过Transformer层生成图像嵌入。然后提出了一个双向融合模块(TWFM),用于计算两种不同嵌入的交叉注意力。利用图像级和提示级特征的相互作用来解决杂波干扰问题。提出了一个自适应形状细化模块(SARM)来减少纵横比的影响。广泛的实验证明了所提出的模型在高分辨率SAR图像上的有效性。P2Det由于其竞争性能提供了多模态物体检测的新的见解。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决从合成孔径雷达(SAR)图像中检测输电塔的问题。由于SAR图像相对较小且是侧视的,背景杂波干扰经常会妨碍塔的识别。本文提出了在定向物体检测器(P2Det)中引入提示学习的方法,以解决这个问题。
  • 关键思路
    本文提出的P2Det模型包含稀疏提示编码和多模态信息学习之间的交叉注意力。通过稀疏提示编码器(SPE)将点位置表示为稀疏嵌入,通过Transformer层生成图像嵌入。然后,提出了双向融合模块(TWFM)来计算两种不同嵌入之间的交叉注意力。利用图像级和提示级特征的交互来解决杂波干扰。提出了形状自适应细化模块(SARM)来减少长宽比的影响。
  • 其它亮点
    本文的亮点包括:提出了一种新的解决SAR图像中检测输电塔的方法;通过引入提示学习,提高了检测的准确性;提出了TWFM和SARM模块,进一步提高了检测的性能;在多个数据集上进行了实验,证明了所提出的模型的有效性。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如:“A Novel Target Detection Method for SAR Images Based on Adaptive Sparse Representation and Nonconvex Penalty”(基于自适应稀疏表示和非凸惩罚的SAR图像目标检测新方法)和“Ship Detection in SAR Images Based on Deep Learning and Superpixel Segmentation”(基于深度学习和超像素分割的SAR图像船舶检测)。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问