本文介绍了连续条件扩散模型(CCDM),它旨在估计高维数据(通常是图像)在标量连续变量(称为回归标签)条件下的分布。虽然连续条件生成对抗网络(CcGAN)最初是为此任务设计的,但它们的对抗训练机制仍然容易受到极度稀疏或不平衡数据的影响,导致结果不尽如人意。为了提高生成图像的质量,一个有前途的替代方案是用条件扩散模型(CDM)替换CcGANs,因为CDM以其稳定的训练过程和产生更真实图像的能力而闻名。然而,现有的CDMs在应用于CCGM任务时遇到了一些挑战,如不足的U-Net架构和处理回归标签的不足模型拟合机制。因此,本文提出了连续条件扩散模型(CCDM),它是专门为CCGM任务设计的第一个CDM。CCDM通过引入特别设计的条件扩散过程、具有自定义条件机制的修改过的去噪U-Net、用于模型拟合的新型硬邻近损失和高效的条件采样过程来解决现有CDMs的局限性。通过对四个分辨率从64x64到192x192的数据集进行全面的实验,我们证明了所提出的CCDM优于最先进的CCGM模型,为CCGM建立了新的基准。广泛的消融研究验证了所提出的CCDM的模型设计和实现配置。我们的代码公开在https://github.com/UBCDingXin/CCDM。
提问交流