Few-Shot Image Generation by Conditional Relaxing Diffusion Inversion

2024年07月09日
  • 简介
    在使用深度生成模型(DGMs)进行少样本图像生成(FSIG)的领域中,准确地估计目标域的分布并用最少的样本是一个重大挑战。这需要一种方法,既能捕捉到目标域分布的广泛多样性,又能体现其真实特征。我们提出了一种名为条件松弛扩散反演(CRDI)的创新“无需训练”的方法,旨在增强合成图像生成中的分布多样性。与传统方法不同,CRDI不依赖于仅有少量样本的微调。相反,它专注于重建每个目标图像实例并通过少样本学习扩展多样性。该方法首先确定扩散模型的样本指导嵌入(SGE),其作用类似于某些生成对抗网络(GAN)模型中的显式潜在代码。随后,该方法涉及一个调度程序,逐步向SGE引入扰动,从而增加多样性。全面的实验表明,我们的方法超越了基于GAN的重建技术,并在性能上与最先进的FSIG方法相当。此外,它还有效地缓解了微调方法的常见缺点,如过度拟合和灾难性遗忘。
  • 图表
  • 解决问题
    本论文旨在解决Few-Shot Image Generation (FSIG)领域中,使用Deep Generative Models (DGMs)时需要准确估计目标域分布的挑战。作者提出了一种新的方法来增强合成图像生成中的分布多样性。
  • 关键思路
    该方法名为Conditional Relaxing Diffusion Inversion (CRDI),是一种“无需训练”的方法,通过重建每个目标图像实例来扩展多样性。相比于传统方法,CRDI不依赖于仅使用少量样本的微调。它通过逐步对SGE引入扰动来增加多样性。
  • 其它亮点
    论文的实验表明,CRDI方法在性能上超越了基于GAN的重建技术,并且与现有的FSIG方法相当。此外,它有效地缓解了微调方法的过度拟合和灾难性遗忘等常见缺陷。
  • 相关研究
    最近在FSIG领域中,还有一些相关的研究被进行,例如:Few-shot learning for image classification: A survey、Few-shot learning with global class representations和Few-Shot Learning: A Survey等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论