- 简介由于其强大的生成图像先验,预训练的文本到图像扩散模型已越来越多地被用于解决真实世界的图像超分辨率(Real-ISR)问题。现有的大多数方法都是从随机噪声开始,在给定低质量(LQ)图像的指导下重建高质量(HQ)图像。虽然已经取得了有希望的结果,但这些Real-ISR方法需要多个扩散步骤才能重现HQ图像,增加了计算成本。同时,随机噪声会在输出中引入不确定性,这对图像恢复任务不友好。为了解决这些问题,我们提出了一种一步有效扩散网络,即OSEDiff,用于Real-ISR问题。我们认为LQ图像包含了恢复其HQ对应物的丰富信息,因此可以直接将给定的LQ图像作为扩散的起点,消除了由随机噪声采样引入的不确定性。我们使用可训练层微调预训练扩散网络,以使其适应复杂的图像退化。为了确保一步扩散模型能够产生HQ Real-ISR输出,我们在潜在空间中应用变分分数蒸馏进行KL散度正则化。因此,我们的OSEDiff模型可以在一个扩散步骤中高效有效地生成HQ图像。我们的实验表明,OSEDiff在客观指标和主观评估方面都比需要数十或数百个步骤的先前基于扩散模型的Real-ISR方法实现了可比或更好的结果。源代码将在https://github.com/cswry/OSEDiff发布。
- 图表
- 解决问题本文旨在解决图像超分辨率问题中,多次扩散步骤和随机噪声带来的计算成本和不确定性问题。同时,论文也试图证明给定的低质量图像包含恢复其高质量版本所需的丰富信息。
- 关键思路本文提出了一种名为OSEDiff的一步有效扩散网络,用于实现图像超分辨率。该网络直接使用给定的低质量图像作为扩散的起点,通过可训练层对预训练扩散网络进行微调,同时在潜在空间中应用KL散度正则化的变分分数蒸馏来确保一步扩散模型能够产生高质量的输出。
- 其它亮点本文的实验结果表明,OSEDiff在仅一次扩散步骤中即可有效地生成高质量图像,相比需要数十次或数百次扩散步骤的先前扩散模型,其结果在客观指标和主观评价方面具有可比性甚至更好。此外,本文还开源了代码,并使用多个数据集进行了实验。
- 最近的相关研究包括:1.《Towards Real Scene Super-Resolution with Raw Images》;2.《Deep Residual Learning for Image Super-Resolution》;3.《Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network》等。
沙发等你来抢
去评论
评论
沙发等你来抢