- 简介本文介绍了连续条件扩散模型(CCDM),它旨在估计高维数据(通常是图像)在标量连续变量(称为回归标签)条件下的分布。虽然连续条件生成对抗网络(CcGAN)最初是为此任务设计的,但它们的对抗训练机制仍然容易受到极度稀疏或不平衡数据的影响,导致结果不尽如人意。为了提高生成图像的质量,一个有前途的替代方案是用条件扩散模型(CDM)替换CcGANs,因为CDM以其稳定的训练过程和产生更真实图像的能力而闻名。然而,现有的CDMs在应用于CCGM任务时遇到了一些挑战,如不足的U-Net架构和处理回归标签的不足模型拟合机制。因此,本文提出了连续条件扩散模型(CCDM),它是专门为CCGM任务设计的第一个CDM。CCDM通过引入特别设计的条件扩散过程、具有自定义条件机制的修改过的去噪U-Net、用于模型拟合的新型硬邻近损失和高效的条件采样过程来解决现有CDMs的局限性。通过对四个分辨率从64x64到192x192的数据集进行全面的实验,我们证明了所提出的CCDM优于最先进的CCGM模型,为CCGM建立了新的基准。广泛的消融研究验证了所提出的CCDM的模型设计和实现配置。我们的代码公开在https://github.com/UBCDingXin/CCDM。
- 图表
- 解决问题本文旨在解决连续条件生成建模(CCGM)中的稀疏或不平衡数据导致的生成图像质量下降的问题,提出了一种新的连续条件扩散模型(CCDM)。
- 关键思路CCDM引入了特殊设计的条件扩散过程、修改后的去噪U-Net网络结构、新颖的硬邻近损失以及高效的条件采样过程,用于解决现有CDM在处理连续条件生成建模任务中的不足之处。
- 其它亮点本文在四个分辨率从64x64到192x192的数据集上进行了全面的实验,并展示了CCDM相对于最先进的CCGM模型的优越性,建立了CCGM的新基准。实验结果表明,CCDM的设计和实现配置得到了验证,具有很高的参考价值。作者还提供了开源代码。
- 近期的相关研究包括CcGANs和CDMs。
沙发等你来抢
去评论
评论
沙发等你来抢