最近一段时间,扩散模型在文图生成领域可谓名声大噪。实际上,扩散模型可以应用到各类 AIGC 任务上,除文图生成为代表的图片生成外,扩散模型还可以进行音频生成、时间序列生成、3D 点云生成、文本生成。

 

而这篇论文,即 Video Diffusion Models,就将扩散模型用到了视频生成任务上,本文将对该论文展开讲解。该论文官方没有公开源码,但是有一些基于该论文的相关开源工作,比如 PaddleNLP 的 PPDiffusers,本文后续也会结合相关代码进行讲解。该论文一作作者为 Jonathan Ho 和 Tim Salimans,来自于谷歌,论文目前已被 NeurIPS 2022 接收。

 

图片

论文链接:https://arxiv.org/abs/2204.03458

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除