Dynamic Negative Guidance of Diffusion Models

2024年10月18日
  • 简介
    负向提示(NP)在扩散模型中被广泛应用,特别是在文本到图像的应用中,用于防止生成不希望出现的特征。在本文中,我们指出传统的NP受限于恒定引导尺度的假设,这可能导致高度次优的结果,甚至完全失败,因为逆过程是非平稳且状态依赖的。基于这一分析,我们推导出一种称为动态负向引导的技术,该技术依赖于对引导进行近乎最优的时间和状态依赖的调制,而无需额外的训练。与NP不同,负向引导需要在去噪过程中估计后验类别概率,这通过在生成过程中跟踪离散马尔可夫链来实现,仅需有限的额外计算开销。我们在MNIST和CIFAR10上评估了DNG类移除的性能,结果显示,与基线方法相比,DNG在提高安全性、保持类别平衡和图像质量方面表现更佳。此外,我们还展示了使用DNG与稳定扩散相结合,可以实现比NP更准确且侵入性更低的引导。
  • 图表
  • 解决问题
    该论文试图解决传统负向提示(Negative Prompting, NP)在扩散模型中的局限性,特别是其在文本到图像生成任务中对不希望出现特征的抑制效果不佳的问题。这是一个现有问题的新解决方案。
  • 关键思路
    论文提出了一种名为动态负向引导(Dynamic Negative Guidance, DNG)的技术,该技术通过在生成过程中动态调整引导尺度,解决了传统NP方法中固定引导尺度导致的非最优结果或完全失败的问题。DNG不需要额外的训练,并且能够更准确地估计后验类别概率,从而实现更有效和侵入性更低的引导。
  • 其它亮点
    论文在MNIST和CIFAR10数据集上评估了DNG的性能,展示了DNG在提高安全性、保持类别平衡和图像质量方面的优势。此外,研究还表明DNG可以与Stable Diffusion结合使用,以获得更准确和更少侵入性的引导效果。论文提供了详细的实验设计和结果分析,但未提及是否有开源代码。
  • 相关研究
    最近在这个领域中,相关的研究包括: 1. "Guidance Scaling in Diffusion Models for Improved Image Generation" - 探讨了不同引导尺度对扩散模型生成效果的影响。 2. "Class-Conditional Guidance in Text-to-Image Synthesis" - 研究了条件引导在文本到图像合成中的应用。 3. "Optimizing Negative Prompts in Generative Models" - 提出了优化负向提示的方法,以提高生成模型的可控性和多样性。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论