DRCT: Saving Image Super-resolution away from Information Bottleneck

简介

最近几年，基于Vision Transformer的低级视觉任务应用取得了广泛的成功。与基于CNN的模型不同，Transformer更擅长捕捉长程依赖关系，从而利用非局部区域的信息重构图像。在超分辨领域，基于Swin-transformer的方法已经成为主流，因为它们具有捕捉全局空间信息的能力和促进不同窗口之间信息交换的移动窗口注意机制。许多研究人员通过扩展感受野或设计复杂网络来提高图像质量和网络效率，取得了令人瞩目的结果。然而，我们观察到在前向传播过程中，随着深度的增加，空间信息往往会减少，导致空间信息的丧失，从而限制了模型的潜力。为了解决这个问题，我们提出了Dense-residual-connected Transformer（DRCT），旨在通过层之间的密集残差连接来减轻空间信息的丢失，从而释放模型的潜力并提高性能。实验结果表明，我们的方法不仅简单直接，而且效率显著，超过了最先进的方法，并在NTIRE2024中表现出色。
图表
解决问题

本论文旨在解决超分辨率领域中，由于深度增加导致空间信息丢失的问题，提出了一种基于密集残差连接的Transformer模型，以提高模型的性能。
关键思路

论文的关键思路是在Transformer模型中引入密集残差连接，以缓解深度增加导致的空间信息丢失问题，从而提高超分辨率模型的性能。
其它亮点

论文的实验结果表明，引入密集残差连接的DRCT模型在超分辨率任务上表现优异，超过了当前最先进的方法。此外，该模型的设计简单、高效，具有很好的可解释性。论文还开源了代码，并使用了NTIRE2024数据集进行了实验。
相关研究

在超分辨率领域中，最近的相关研究包括：1. SwinIR: Image Restoration Using Swin Transformer，2. RCAN: Image Super-Resolution Using Very Deep Residual Channel Attention Networks，3. ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks。

DRCT: Saving Image Super-resolution away from Information Bottleneck

评论