论文链接:https://arxiv.org/pdf/2205.04639.pdf

语义分割广泛应用于自动驾驶和智能交通,其对空间和语义信息的要求很高。在这里提出了STDC-MA来满足这些需求。首先,STDC-MA采用了STDC-Seg结构,以确保结构轻巧高效。随后,应用特征对齐模块FAM)来理解高层特征和低层特征之间的偏移,解决高层特征图上与上采样相关的像素偏移问题。

STDC-MA实现了高级特征和低级特征之间的有效融合。采用分层多尺度注意力机制从一张图像的两个不同输入尺寸中揭示注意力区域之间的关系。通过这种关系,将受关注的区域整合到分割结果中,从而减少输入图像的未关注的区域,提高多尺度特征的有效利用。

STDC-MA保持了STDC-Seg网络的分割速度,同时提高了小物体的分割精度。STDC-MACityscapes的验证集上进行了验证。STDC-MA的分割结果在0.5× scale的输入下达到了76.81%的mIOU,比STDC-Seg高3.61%。

内容中包含的图片若涉及版权问题,请及时与我们联系删除