Heavy-Tailed Diffusion Models

2024年10月18日
  • 简介
    扩散模型在许多应用中实现了最先进的生成质量,但它们捕捉重尾分布中的罕见或极端事件的能力仍然不明确。在这项工作中,我们展示了传统的带有标准高斯先验的扩散模型和流匹配模型无法捕捉重尾行为。为了解决这一问题,我们将扩散框架重新用于重尾估计,采用多变量的t分布。我们开发了一个定制的扰动核,并基于条件t分布推导了反向过程的去噪后验。受用于重尾分布的γ-散度的启发,我们推导出一个适用于重尾去噪器的训练目标。由此产生的框架通过仅使用一个标量超参数即可实现可控的尾部生成,使其能够轻松调整以适应各种实际分布。作为我们框架的具体实例,我们引入了t-EDM和t-Flow,这是现有扩散模型和流模型的扩展,采用了t分布先验。值得注意的是,我们的方法与标准的高斯扩散模型高度兼容,只需要进行最小的代码更改。实证结果表明,我们的t-EDM和t-Flow在高分辨率天气数据集上的重尾估计中优于标准扩散模型,这些数据集中生成罕见和极端事件至关重要。
  • 图表
  • 解决问题
    该论文旨在解决传统扩散模型和流匹配模型在处理重尾分布时的不足,特别是它们难以捕捉到罕见或极端事件的问题。这是一个在生成模型领域较为新颖的研究方向。
  • 关键思路
    论文的关键思路是通过引入多变量Student-t分布作为先验,重新设计扩散框架以适应重尾分布。具体来说,作者开发了一个定制的扰动核,并基于条件Student-t分布推导了反向过程的去噪后验。此外,还提出了一个基于γ-散度的训练目标,用于优化重尾去噪器。这种方法仅需调整一个标量超参数即可实现可控的尾部生成。
  • 其它亮点
    论文的主要亮点包括:1) 提出了t-EDM和t-Flow两种扩展模型,分别基于现有的扩散模型和流模型;2) 实验表明,这些模型在高分辨率天气数据集上优于标准的高斯扩散模型,特别是在生成罕见和极端事件方面;3) 该方法与标准的高斯扩散模型兼容,只需少量代码修改即可实现;4) 论文提供了开源代码,便于复现和进一步研究。
  • 相关研究
    近期在生成模型领域,一些相关研究包括:1) 'Heavy-Tailed Generative Models for Image Synthesis',探讨了使用重尾分布进行图像生成的方法;2) 'Tail-Robust Generative Adversarial Networks',研究了如何使GAN对尾部数据更鲁棒;3) 'Flow-based Models for Heavy-Tailed Data',提出了一种基于流模型的重尾数据生成方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论