Attentional Feature Fusion

论文链接:https://arxiv.org/abs/2009.14082 代码链接:https://github.com/YimianDai/open-aff

一种新注意力机制!性能优于SKNet、SENet等方法,可应用于分类、语义分割和目标检测等方向,代码刚刚开源!作者单位:南航, 明斯特大学, 哥本哈根大学等

特征融合是来自不同层或分支的特征的组合,是现代网络体系结构中无所不在的一部分。它通常通过简单的操作(例如求和或串联)来实现,但这可能不是最佳选择。在这项工作中,我们提出了一个统一而通用的方案,即注意力特征融合,该方案适用于大多数常见场景,包括由short and long skip connections以及在Inception层内引起的特征融合。为了更好地融合语义和尺度不一致的特征,我们提出了一个多尺度的通道注意力模块,该模块解决了在融合不同尺度的特征时出现的问题。我们还证明了特征图的初始集成可能会成为瓶颈,并且可以通过添加另一个注意力级别(称为迭代注意力特征融合)来缓解此问题。由于图层或参数较少,我们的模型在CIFAR-100和ImageNet数据集上均优于最新的网络,这表明与特征直接融合相比,用于特征融合的更复杂的注意力机制具有持续产生更好结果的巨大潜力。我们的代码和训练有素的模型可在线获得。

内容中包含的图片若涉及版权问题,请及时与我们联系删除