CCDM: Continuous Conditional Diffusion Models for Image Generation

简介

本文介绍了连续条件扩散模型（CCDM），它旨在估计高维数据（通常是图像）在标量连续变量（称为回归标签）条件下的分布。虽然连续条件生成对抗网络（CcGAN）最初是为此任务设计的，但它们的对抗训练机制仍然容易受到极度稀疏或不平衡数据的影响，导致结果不尽如人意。为了提高生成图像的质量，一个有前途的替代方案是用条件扩散模型（CDM）替换CcGANs，因为CDM以其稳定的训练过程和产生更真实图像的能力而闻名。然而，现有的CDMs在应用于CCGM任务时遇到了一些挑战，如不足的U-Net架构和处理回归标签的不足模型拟合机制。因此，本文提出了连续条件扩散模型（CCDM），它是专门为CCGM任务设计的第一个CDM。CCDM通过引入特别设计的条件扩散过程、具有自定义条件机制的修改过的去噪U-Net、用于模型拟合的新型硬邻近损失和高效的条件采样过程来解决现有CDMs的局限性。通过对四个分辨率从64x64到192x192的数据集进行全面的实验，我们证明了所提出的CCDM优于最先进的CCGM模型，为CCGM建立了新的基准。广泛的消融研究验证了所提出的CCDM的模型设计和实现配置。我们的代码公开在https://github.com/UBCDingXin/CCDM。
图表
解决问题

本文旨在解决连续条件生成建模（CCGM）中的稀疏或不平衡数据导致的生成图像质量下降的问题，提出了一种新的连续条件扩散模型（CCDM）。
关键思路

CCDM引入了特殊设计的条件扩散过程、修改后的去噪U-Net网络结构、新颖的硬邻近损失以及高效的条件采样过程，用于解决现有CDM在处理连续条件生成建模任务中的不足之处。
其它亮点

本文在四个分辨率从64x64到192x192的数据集上进行了全面的实验，并展示了CCDM相对于最先进的CCGM模型的优越性，建立了CCGM的新基准。实验结果表明，CCDM的设计和实现配置得到了验证，具有很高的参考价值。作者还提供了开源代码。
相关研究

近期的相关研究包括CcGANs和CDMs。

CCDM: Continuous Conditional Diffusion Models for Image Generation

评论