HMANet: Hybrid Multi-Axis Aggregation Network for Image Super-Resolution

向作者提问

NEW

简介

基于Transformer的方法已经在超分辨率视觉任务上展现出了出色的性能，超过了传统的卷积神经网络。然而，现有的工作通常将自注意力计算限制在非重叠窗口中以节省计算成本。这意味着基于Transformer的网络只能使用有限的空间范围内的输入信息。因此，本文提出了一种新的混合多轴聚合网络（HMA），以更好地利用特征潜在信息。HMA通过堆叠残差混合Transformer块（RHTB）和网格注意块（GAB）构建。一方面，RHTB结合通道注意力和自注意力来增强非局部特征融合，并产生更有吸引力的视觉结果。另一方面，GAB用于跨域信息交互，共同建模相似特征并获得更大的感知场。对于训练阶段的超分辨率任务，设计了一种新的预训练方法，进一步增强了模型的表示能力，并通过多个实验验证了所提出模型的有效性。实验结果表明，HMA在基准数据集上优于现有最先进方法。我们在https://github.com/korouuuuu/HMA上提供代码和模型。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决超分辨率视觉任务中Transformer方法的局限性，即当前的方法通常限制自注意力计算在非重叠窗口中以节省计算成本，从而只能利用有限的空间范围内的输入信息。
关键思路

论文提出了一种新颖的混合多轴聚合网络（HMA），通过堆叠残差混合Transformer块（RHTB）和网格注意块（GAB）来更好地利用特征潜在信息。其中，RHTB结合通道注意力和自注意力以增强非局部特征融合，从而产生更具吸引力的视觉结果；而GAB则用于跨域信息交互，共同建模相似特征并获得更大的感知场。此外，论文还设计了一种新的预训练方法来进一步增强模型的表示能力。
其它亮点

论文通过实验验证了HMA在基准数据集上的优越性，并提供了代码和模型。实验设计了一个预训练方法来增强模型的表示能力，使用了多个数据集进行实验，证明了HMA的有效性。此外，论文的创新点在于提出了一种新的混合多轴聚合网络，该网络在超分辨率任务中表现优异。
相关研究

最近在这个领域中，还有一些相关的研究被进行，如《Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network》、《Deep Residual Learning for Image Super-Resolution》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问