- 简介分数蒸馏采样对于将扩散模型整合到复杂视觉生成中至关重要。尽管取得了令人印象深刻的结果,但它面临着模式崩溃和缺乏多样性的问题。为了应对这一挑战,我们利用分数蒸馏的梯度流解释提出了排斥分数蒸馏(RSD)。具体而言,我们提出了一个基于排斥粒子集合的变分框架,以促进多样性。使用一种包含粒子之间耦合的变分近似,排斥作为一种简单的正则化出现,允许基于它们的相对成对相似性(例如通过径向基核测量)的粒子相互作用。我们为无约束和有约束的采样情况设计了RSD。对于有约束的采样,我们专注于潜在空间中的反问题,这导致了一个增广的变分公式,它在计算、质量和多样性之间取得了良好的平衡。我们在文本到图像生成和反问题的广泛实验中表明,与现有技术相比,RSD在多样性和质量之间取得了更好的折衷。
- 图表
- 解决问题论文旨在解决分数蒸馏采样在生成复杂视觉时存在的模式崩溃和缺乏多样性的问题。
- 关键思路提出了一种基于排斥力的分数蒸馏方法(RSD),通过粒子之间的相对相似度来促进多样性,从而达到更好的质量和多样性平衡。
- 其它亮点论文设计了RSD用于文本到图像生成和潜空间中的反问题,实验结果表明与现有方法相比,RSD在质量和多样性之间达到了更好的平衡。
- 与该论文相关的研究包括分数蒸馏采样和生成模型的其他改进方法,如GAN、VAE等。
沙发等你来抢
去评论
评论
沙发等你来抢