AMSA-UNet: An Asymmetric Multiple Scales U-net Based on Self-attention for Deblurring

2024年06月13日
  • 简介
    传统的单尺度 U-Net 在去模糊过程中往往会导致空间信息的丢失,从而影响去模糊的准确性。此外,由于卷积方法在捕捉长距离依赖方面的局限性,恢复图像的质量会降低。为了解决以上问题,提出了一种基于自注意力的不对称多尺度 U-Net(AMSA-UNet),以提高准确性和计算复杂度。通过引入多尺度 U 形结构,网络可以在全局层面上聚焦模糊区域,并在局部层面上更好地恢复图像细节。为了克服传统卷积方法在捕捉信息长距离依赖方面的局限性,引入了自注意力机制到主干网络的解码器部分,从而显著增加了模型的感受野,使其能够更多地关注图像的语义信息,从而产生更准确和视觉上令人愉悦的去模糊图像。此外,还引入了一种基于频域的计算方法来减少计算量。实验结果表明,与八种优秀的方法相比,所提出的方法在准确性和速度方面都有显著提高。
  • 图表
  • 解决问题
    AMSA-UNet论文旨在解决图像去模糊任务中传统单尺度U-Net模型在空间信息丢失和长距离依赖捕捉方面的问题,提高去模糊的准确性和速度。
  • 关键思路
    论文提出了一种基于自注意力机制的不对称多尺度U-Net模型(AMSA-UNet),通过引入多尺度U形结构,实现了对全局模糊区域和局部图像细节的更好关注。在解码器的骨干网络中引入自注意力机制,显著增加了模型的感受野,使其能够更好地关注图像的语义信息,从而产生更准确和视觉上令人愉悦的去模糊图像。此外,还引入了基于频域的计算方法来减少计算量。
  • 其它亮点
    论文在多个数据集上进行了实验,证明了AMSA-UNet模型在准确性和速度方面相比其他8种优秀方法有显著提高。此外,论文还开源了代码,方便其他研究者使用和进一步改进。
  • 相关研究
    在图像去模糊领域,最近的一些相关研究包括:Multi-scale Residual Network for Image Restoration、Deep Image Prior、Deep Generative Prior等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论