- 简介在遥感图像中进行目标检测往往面临着许多挑战,包括目标尺度的巨大变化和背景多样化。以前的方法试图通过扩展骨干网格的空间感受野来解决这些挑战,要么通过大卷积核,要么通过扩张卷积。然而,前者通常会引入相当多的背景噪音,而后者则可能会产生过于稀疏的特征表示。本文引入了Poly Kernel Inception Network(PKINet)来处理上述挑战。PKINet采用多尺度卷积核而不是扩张卷积来提取不同尺度的目标特征和捕捉局部上下文。此外,还引入了Context Anchor Attention(CAA)模块来捕捉远距离的上下文信息。这两个组件共同作用,提高了PKINet在四个具有挑战性的遥感检测基准上的性能,分别是DOTA-v1.0,DOTA-v1.5,HRSC2016和DIOR-R。
- 图表
- 解决问题PKINet试图解决遥感图像中物体检测的挑战,如不同尺度物体和多样化背景等问题。
- 关键思路PKINet采用多尺度卷积核提取具有不同尺度的物体特征并捕捉局部上下文,同时引入上下文锚点注意力模块以捕获长程上下文信息。
- 其它亮点PKINet在四个具有挑战性的遥感检测基准数据集上的表现优于现有方法,包括DOTA-v1.0,DOTA-v1.5,HRSC2016和DIOR-R。
- 先前的方法通过扩大主干网络的空间感受野来解决这些挑战,但会引入噪声或过于稀疏的特征表示。
沙发等你来抢
去评论
评论
沙发等你来抢