- 简介扩散模型展现了模拟复杂数据分布的惊人能力,相较于生成对抗网络(GANs),具有更稳定的训练、更好的覆盖训练分布的模式以及无需额外训练即可解决反问题等多个关键优势。然而,大多数扩散模型学习的是固定分辨率图像的分布。我们提出在图像神经场上训练扩散模型,以学习连续图像的分布,这些图像可以在任意分辨率下呈现,并展示了其相较于固定分辨率模型的优势。为了实现这一目标,一个关键挑战是获得代表照片级图像神经场的潜空间。我们提出了一种简单有效的方法,受到最近几种技术的启发,但有关键改变以使图像神经场更加逼真。我们的方法可以用于将现有的潜空间扩散自编码器转换为图像神经场自编码器。我们展示了图像神经场扩散模型可以使用混合分辨率图像数据集进行训练,优于先训练固定分辨率扩散模型再进行超分辨率模型,且可以高效地解决不同尺度条件下的反问题。
-
- 图表
- 解决问题本论文旨在通过在图像神经场上训练扩散模型来学习连续图像的分布,以解决固定分辨率图像模型的局限性。
- 关键思路论文提出了在图像神经场上训练扩散模型来学习连续图像的分布的方法,并提出了一种简单有效的方法来获得代表逼真图像神经场的潜在空间。
- 其它亮点论文使用了混合分辨率图像数据集,比固定分辨率的扩散模型和超分辨率模型表现更好,并且能够有效地解决不同尺度条件下的逆问题。此外,论文提供了开源代码。
- 最近的相关研究包括GAN和其他扩散模型的应用,如DDIM和DVAE。


提问交流