DALL·E 2 之所以能够生成十分惊艳的图像,扩散模型功不可没,相比 GAN,该模型可以生成更多样,更高质量的图像(缺点在于计算量很大,需要反复迭代)。扩散模型的思想很简单,inference 的时候给定一个噪声信号作为输入,训练一个模型估计高斯噪声,用噪声减去这个预测的噪声,然后重复迭代以上操作直至恢复原始信号。理论上,可以用于语音合成、图像生成、超分辨率等连续信号的生成。
本文主要介绍扩散模型及其在图像生成领域的应用,主要包括以下部分:
  • 扩散模型(diffusion model)的原理
  • 引导扩散模型 guided diffusion model(classifier-guidance, semantic-guidance, classifier-free-guidance)
  • GLIDE
  • DALL·E 2

内容中包含的图片若涉及版权问题,请及时与我们联系删除