在图像处理中,图像的高频区域(边缘、纹理等)直接影响着结果的视觉感官质量。本文工作重新思考了图像梯度在深度学习网络中的构建,从像素级对噪声图像进行分层,为网络输入提供更多的结构信息,并通过反向传播梯度引导网络学习高频特征。最后提出了即插即用的锐化损失解决去噪图像过于平滑的问题,突出图像中的高频信息而不影响低频信息。在模拟噪声和真实噪声数据benchmark数据集上实现了SOTA。

本文亮点主要包括:

  1. 提出一种基于双U-Net的分层输入梯度网络(LIGN)。在基准数据集上的实验表明,该网络在PSNR和SSIM指标上表现出优异的性能。
  2. 提出了一种新的分层输入法,充分利用了输入图像的内部结构和频率信息。
  3. 将图像梯度深度融合到网络中,从而使网络收敛速度更快,并获得更多高频特征关注。

本文工作『Layered Input GradiNet for Image Denoising』发表于Knowledge-Based Systems (KBS),2022,254:109587。中科院1区、Top期刊。

  • 论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0950705122008000
  • 代码:https://github.com/JerryYann/LIGN
  • 单位:东北师范大学
  • 作者:乔双,杨家瑞,张天,赵辰一*

数字图像广泛应用于日常生活中。受多因素影响,如硬件条件、环境变量等,成像系统所成的图像都不可避免存在一定程度的质量退化,其中常见退化现象之一为噪声。噪声的存在对人眼感官,图像结构分析、医学诊断、科学研究等影响较大。因此,图像去噪作为计算机视觉领域的研究热点之一,一直受到科研人员的广泛关注。

本文研究方向围绕具体应用而展开。提出分层输入梯度网络(LIGN),从网络输入端到网络深层结构,以及网络的损失层均提出创新性结构。深度挖掘图像的结构信息,探讨图像不同频率特征的作用,以及通过锐化损失大幅度提高图像的视觉质量。分别在模拟噪声数据集和真实噪声数据集上,在PSNR和SSIM指标实现了SOTA。

图1 整体网络框架

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除