知乎上的一个问题。高赞的回答有:

UCSD的Zhifeng Kong有比较多Diffusion model的经验:

GAN 能更灵活处理不同任务,应用层面部署比较容易,需要的资源小,不过学术上竞争激烈,有时生成的样本质量比较一般。Diffusion model 相对不太灵活,缺少良好的 latent space 性质,资源消耗极大,但生成效率略高于auto-regressive model, 主要优点质量好,学术上容易出论文。
……
其实不同的模型本身就擅长不同领域不同任务,没有必要一定说一个好于另一个。比如说,speech synthesis 天生更适合用auto regressive, data compression 天生适合用 (variational) auto encoder, 图像编辑就很适合用 GAN. 我们或许也能说 大数据集,高分辨率图像生成可能更适合用 Diffusion model. 至于学术潜力,diffusion model 完胜,毕竟GAN的坑都差不多了。

搞GAN比较多的王不对
第一个感受就是,相对于GAN,它(Diffusion model)对数学的要求还挺高。不像GAN,应用时很多改进可以凭“直觉”加,感觉有道理就可以试试...,但是Diffusion模型每一步似乎都是有对应的数学基础的。调整其细节时,必须仔细思考背后的数学基础。如果它火起来,成为生成模型的主流,对我这种数学基础很差的人肯定是巨大打击 。
对了,他还写了一篇Diffusion model方面的入门文章
大家怎么看?

内容中包含的图片若涉及版权问题,请及时与我们联系删除