DeblurDiNAT: A Lightweight and Effective Transformer for Image Deblurring

简介

模糊的图像可能包含局部和全局的非均匀伪影，这使得去模糊过程更加复杂，难以达到令人满意的结果。最近，Transformers生成的去模糊结果比现有的CNN架构更好。然而，大模型大小和长推理时间仍然是两个令人困扰的问题，尚未得到充分探讨。因此，我们提出了DeblurDiNAT，一种紧凑的编码器-解码器Transformer，它可以有效地从现实世界的模糊图像中恢复清晰图像。我们采用交替膨胀因子结构，旨在进行全局-局部特征学习。此外，我们观察到，仅在网络中使用自注意力层并不总是产生良好的去模糊结果。为了解决这个问题，我们提出了一个通道调制自注意力（CMSA）块，其中利用交叉通道学习器（CCL）来捕捉通道关系。此外，我们还设计了一个轻量级的门控特征融合（LGFF）模块，可以执行受控特征合并。全面的实验结果表明，所提出的DeblurDiNAT模型在不引入明显的计算成本的情况下提供了有利的性能提升，并在几个图像去模糊数据集上实现了最先进的性能。与最近的竞争对手相比，我们的节省空间和节省时间的方法表现出更强的泛化能力，具有3％-68％更少的参数，并生成更接近真实图像的去模糊图像。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

DeblurDiNAT旨在解决模糊图像去模糊的问题，尤其是在存在局部和全局非均匀伪影的情况下。
关键思路

DeblurDiNAT采用了一种紧凑的编码器-解码器Transformer结构，其中包括交替的膨胀因子结构、通道调制自注意力块、分裂和乘法前馈网络和轻量级门控特征融合模块。
其它亮点

论文采用了多个数据集进行实验，并且在性能和计算成本方面都表现出色。论文提出的模型比现有的CNN架构表现更好，同时计算成本更低。此外，论文还提出了通道调制自注意力块和轻量级门控特征融合模块等创新点。
相关研究

最近的相关研究包括：《Deep Multi-Patch Hierarchical Network for Image Deblurring》、《Blind Image Deblurring Using Dark Channel Prior》、《A Deep Convolutional Neural Network for Image Deblurring》等。

DeblurDiNAT: A Lightweight and Effective Transformer for Image Deblurring

提问交流

提问交流