Invertible Residual Rescaling Models

2024年05月05日
  • 简介
    Invertible Rescaling Networks(IRN)及其变种在各种图像处理任务中,如图像缩放,取得了显著的成就。然而,我们观察到,具有更深的网络的IRN很难训练,从而阻碍了IRN的表征能力。为解决这个问题,我们提出了可逆残差缩放模型(IRRM),通过学习高分辨率图像与其低分辨率对应物之间的双射来进行图像缩放。具体而言,我们提出了IRRM来构建一个深层网络,其中包含多个具有长跳跃连接的残差下采样模块(RDM)。每个RDM由多个具有短连接的可逆残差块(IRB)组成。通过这种方式,RDM允许富含低频信息的信息通过跳跃连接被绕过,并迫使模型专注于从图像中提取高频信息。广泛的实验表明,我们的IRRM比其他最先进的方法表现显著,而且参数和复杂度更少。特别是,在4倍缩放中,我们的IRRM分别比HCFlow和IRN具有至少0.3 dB的PSNR增益,而仅使用60%的参数和50%的FLOPs。代码将在https://github.com/THU-Kingmin/IRRM上提供。
  • 图表
  • 解决问题
    本论文旨在解决Invertible Rescaling Networks (IRNs)随着网络深度的增加而难以训练,从而限制了IRNs的表征能力的问题。作者提出了Invertible Residual Rescaling Models (IRRM)作为解决方案。
  • 关键思路
    IRRM通过学习将高分辨率图像与其低分辨率对应物之间的双射关系来进行图像缩放。IRRM由多个Residual Downscaling Modules (RDMs)组成,每个RDM由多个Invertible Residual Blocks (IRBs)组成。RDM通过长跳跃连接绕过丰富的低频信息,迫使模型专注于从图像中提取高频信息。
  • 其它亮点
    论文的实验表明,IRRM在参数和复杂度远低于其他最先进方法的情况下,分别在4倍缩放下具有至少0.3 dB的PSNR增益。作者将代码开源并提供了github链接。
  • 相关研究
    与本论文相关的研究包括IRNs以及其他图像缩放方法,如SRCNN和FSRCNN。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论