扩散模型是近年来快速发展并得到广泛关注的生成模型。它通过一系列的加噪和去噪过程,在复杂的图像分布和高斯分布之间建立联系,使得模型最终能将随机采样的高斯噪声逐步去噪得到一张图像。最新学者发布了关于《高效视觉扩散模型》综述论文,对扩散模型在视觉领域的现状进行详细的综述。通过对改进算法和在其他领域的应用进行分类。值得关注!

图片

扩散模型(DMs)在不需要对抗训练的情况下展示了最先进的内容生成性能。这些模型使用两步过程进行训练。首先,前向扩散过程逐渐向数据(通常是图像)添加噪声。然后,反向扩散过程逐步去除噪声,将其转化为被建模目标分布的样本。DMs的灵感来源于非平衡态热力学,具有固有的高计算复杂度。由于在高维空间中频繁的函数计算和梯度计算,这些模型在训练和推理阶段都会产生大量的计算开销。这不仅阻碍了扩散模型的民主化,而且阻碍了扩散模型在实际应用中的适应性。更不用说,由于过度的能源消耗和对环境的担忧,计算模型的效率正在迅速成为一个重要的问题。这些因素导致了文献中对设计计算高效的DM的多项贡献。在这篇综述中,我们介绍了视觉扩散模型的最新进展,特别关注影响DMs计算效率的重要设计方面。我们特别强调最近提出的设计选择,这些设计选择导致了更高效的DM。不像最近的其他评论,从广泛的角度讨论扩散模型,本综述旨在通过强调文献中的设计策略,推动这一研究方向向前发展,为更广泛的研究社区带来了可实施的模型。从计算效率的角度展望了视觉中扩散模型的发展前景。

论文链接:https://arxiv.org/abs/2210.09292

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除