- 简介最近,扩散概率模型在生成高质量图像方面取得了显著成功。然而,在图像压缩应用中,平衡高感知质量和低失真仍然具有挑战性。为了解决这个问题,我们提出了一种高效的基于不确定性引导的图像压缩方法,采用小波扩散(UGDiff)。我们的方法通过小波变换专注于高频压缩,因为高频分量对于重建图像细节至关重要。我们引入了一个小波条件扩散模型用于高频预测,随后是一个残差编解码器,将预测残差压缩和传输到解码器。这种扩散预测-残差压缩范式有效地解决了现有扩散模型直接重构中常见的低保真度问题。考虑到扩散模型的随机采样带来的不确定性,我们进一步设计了一个针对残差压缩量身定制的不确定性加权速率失真(R-D)损失,提供了更合理的速率和失真之间的权衡。对两个基准数据集的全面实验验证了UGDiff的有效性,超越了最先进的图像压缩方法在R-D性能、感知质量、主观质量和推理时间方面。我们的代码可在以下链接中获得:https://github.com/hejiaxiang1/Wavelet-Diffusion/tree/main。
- 图表
- 解决问题论文旨在解决图像压缩中高感知质量和低失真的平衡问题,提出了一种基于波尔兹曼扩散模型的不确定性引导图像压缩方法。
- 关键思路论文提出的UGDiff方法通过波尔兹曼扩散模型进行高频率预测,并采用残差编解码器进行预测残差的压缩和传输,有效解决了现有扩散模型直接重构图像失真的问题。此外,论文还设计了一种基于不确定性加权的速率失真损失函数,以提供更合理的速率和失真之间的权衡。
- 其它亮点论文在两个基准数据集上进行了全面的实验,证明了UGDiff方法在速率失真性能、感知质量、主观质量和推理时间等方面均优于现有图像压缩方法。论文代码已在GitHub上开源。
- 在最近的相关研究中,还有一些与UGDiff相关的研究,例如:'Improved Image Compression with Discretized Gaussian Mixture Likelihood Estimation'和'Variational Image Compression with a Scale Hyperprior'。
沙发等你来抢
去评论
评论
沙发等你来抢