一种基于扩散的方法DreamPose：通过稳定的扩散进行静止图像到视频的合成

标题：DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion

作者：Johanna Karras, Aleksander Holynski, Ting-Chun Wang, Ira Kemelmacher-Shlizerman

[University of Washington, UC Berkeley, Google Research, NVIDIA]

简介：

本文提出了DreamPose，一种基于扩散的方法，用于从静止图像生成动画时装视频。给定一张图片和一连串的人体姿势，我们的方法可以合成一个包含人体和织物运动的视频。为了实现这一目标，我们将一个预先训练好的文本-图像模型（稳定扩散）转化为一个姿势-图像引导的视频合成模型，使用一种新的微调策略、一套架构变化来支持添加的调节信号，以及鼓励时间一致性的技术。

我们在UBC时尚数据集的时尚视频集合上进行微调。我们在各种服装风格和姿势上评估了我们的方法，并证明我们的方法在时尚视频动画上产生了最先进的结果。

视频结果可在我们的项目页面上找到。

project page: grail.cs.washington.edu/projects/dream

github: github.com/johannakarras/

https://arxiv.org/pdf/2304.06025.pdf

内容中包含的图片若涉及版权问题，请及时与我们联系删除

一种基于扩散的方法DreamPose： 通过稳定的扩散进行静止图像到视频的合成

评论

一种基于扩散的方法DreamPose：通过稳定的扩散进行静止图像到视频的合成