- 简介扩散模型已成为图像合成的主流方法,展现出卓越的照片真实感和多样性。然而,在高分辨率下训练扩散模型在计算上仍然非常昂贵,而现有的零样本生成技术在超越训练分辨率的图像合成中常常会产生一些伪影,例如物体重复和空间不一致。本文提出了HiWave,这是一种无需训练、支持零样本生成的新方法,能够显著提升超高清图像合成的视觉质量和结构一致性,且仅需使用预训练的扩散模型。 我们的方法采用了一个两阶段的流程:首先从预训练模型生成一张基础图像,接着通过逐块的DDIM反演步骤,以及一个新颖的基于小波的细节增强模块来提升图像质量。具体来说,我们首先利用反演方法获得能够保留基础图像全局一致性的初始噪声向量;随后在采样过程中,我们的小波域细节增强模块保留基础图像中的低频成分以确保结构一致性,同时有针对性地引导高频成分来丰富细节和纹理。 通过对Stable Diffusion XL的广泛评估表明,HiWave能有效缓解先前方法中常见的视觉伪影,实现更优的感知质量。用户研究结果也证实了HiWave的优越性,在超过80%的对比中用户更倾向于选择HiWave生成的图像。这凸显了该方法在无需重新训练或修改网络结构的前提下,实现高质量、超高清图像合成的有效性。
- 图表
- 解决问题论文试图解决在超高分辨率图像合成中常见的视觉伪影问题,例如物体重复和空间不连贯性。现有方法要么需要昂贵的训练过程,要么在零样本生成中表现不佳。这是一个当前研究中的重要问题,因为高分辨率图像生成在许多应用中至关重要。
- 关键思路论文提出了一种无需训练、零样本的HiWave方法,通过两阶段流程提升预训练扩散模型在超高分辨率下的生成质量。其核心思想是在潜在空间中使用基于小波的细节增强模块,在保持低频结构一致性的同时增强高频纹理细节。
- 其它亮点{"HiWave是一个无需重新训练或修改架构的方法,适用于如Stable Diffusion XL等现有模型。",引入了基于小波变换的细节增强模块,在频域上分离并优化高频与低频信息。,实验表明HiWave在视觉质量上优于现有方法,并在用户研究中获得超过80%的偏好率。,方法在多个评估指标上表现出色,有效缓解了对象重复和结构不一致等问题。,未来的研究方向可以包括将该方法扩展到视频生成或3D内容生成领域。}
- {"Diffusion Models for Image Synthesis: High-Resolution Generation with Latent Consistency","Zero-Shot Super-Resolution with Diffusion Models via Progressive Refinement","Wavelet-Based Frequency Analysis in Deep Learning for Enhanced Image Generation","High-Resolution Image Generation via Multi-Scale Diffusion Inversion","Enhancing Structural Coherence in Text-to-Image Diffusion Models"}
沙发等你来抢
去评论
评论
沙发等你来抢