Frequency-Adaptive Dilated Convolution for Semantic Segmentation

2024年03月08日
  • 简介
    本研究提出了三种改进空洞卷积的策略,从频谱分析的角度优化了空洞卷积的各个阶段。与传统做法固定全局膨胀率超参数不同,引入了一种自适应频率的空洞卷积(FADC),根据局部频率成分动态调整膨胀率。随后,设计了两个插件模块来直接增强有效带宽和感受野大小。自适应核(AdaKern)模块将卷积权重分解为低频和高频成分,并根据每个通道动态调整这些成分之间的比例。通过增加卷积权重的高频部分,AdaKern 捕获更多高频成分,从而提高有效带宽。频率选择(FreqSelect)模块通过空间变量加权最优地平衡特征表示中的高低频成分。它抑制背景中的高频成分,以鼓励 FADC 学习更大的膨胀率,从而扩大感受野。分割和目标检测的大量实验证实了我们方法的有效性。代码公开在 \url{https://github.com/Linwei-Chen/FADC}。
  • 图表
  • 解决问题
    本论文旨在提出三种策略来改进扩张卷积的各个阶段,从频谱分析的角度出发,以提高计算机视觉任务的性能。
  • 关键思路
    本论文提出了三种策略来改进扩张卷积的各个阶段,包括基于本地频率组件动态调整扩张率的Frequency-Adaptive Dilated Convolution(FADC),以及Adaptive Kernel(AdaKern)模块和Frequency Selection(FreqSelect)模块,这两个模块可以直接增强有效带宽和感受野大小。
  • 其它亮点
    本论文的亮点包括提出了三种新颖的策略来改进扩张卷积,包括FADC、AdaKern模块和FreqSelect模块;通过对分割和物体检测等任务的广泛实验验证了本文方法的有效性;提供了公开的代码和数据集。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如“Dilated Convolutional Neural Networks”(Yu等),“Multi-Scale Context Aggregation by Dilated Convolutions”(Yu等),以及“DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs”(Chen等)。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论