DRCT: Saving Image Super-resolution away from Information Bottleneck

2024年03月31日
  • 简介
    最近几年,基于Vision Transformer的低级视觉任务应用取得了广泛的成功。与基于CNN的模型不同,Transformer更擅长捕捉长距离的依赖关系,使得利用来自非局部区域的信息重建图像成为可能。在超分辨率领域,基于Swin-transformer的方法已经成为主流,因为它们具有捕获全局空间信息的能力和移动窗口注意机制,可以促进不同窗口之间的信息交换。许多研究人员通过扩展感受野或设计复杂的网络来提高图像质量和网络效率,取得了可观的结果。然而,我们观察到随着深度的增加,空间信息往往在前向传播过程中逐渐减少,导致空间信息的丧失,从而限制了模型的潜力。为了解决这个问题,我们提出了Dense-residual-connected Transformer (DRCT),旨在通过层之间的密集残差连接来减轻空间信息的丧失,从而释放模型的潜力并提高性能。实验结果表明,我们的方法不仅简单直接,而且效率显著,超过了最先进的方法,并在NTIRE2024表现出色。
  • 图表
  • 解决问题
    论文旨在解决超分辨率领域中深度增加导致空间信息丢失的问题,提出一种通过稠密残差连接解决空间信息丢失的Transformer模型(DRCT)。
  • 关键思路
    论文的关键思路是通过在Transformer模型中引入稠密残差连接,使得不同层之间可以直接传递信息,从而防止空间信息在前向传播过程中丢失。
  • 其它亮点
    论文的实验结果表明,DRCT模型在提高效率的同时,也取得了比其他先进方法更好的性能表现。论文使用了Swin Transformer作为基础架构,并在NTIRE2024数据集上进行了测试。该论文的代码已经开源。
  • 相关研究
    在超分辨率领域,最近的相关研究包括:'SwinIR: Image Restoration Using Swin Transformer'、'Residual Dense Network for Image Super-Resolution'、'Deep Back-Projection Networks for Super-Resolution'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论