COT Flow: Learning Optimal-Transport Image Sampling and Editing by Contrastive Pairs

2024年06月17日
  • 简介
    扩散模型在高质量的多模态数据采样和编辑方面表现出色,但它们受迭代生成过程的计算负担和速度缓慢的影响。此外,大多数方法受限于从高斯噪声生成数据,这限制了它们的采样和编辑灵活性。为了克服这两个缺点,我们提出了对比最优传输流(COT Flow),这是一种新的方法,与以前的扩散模型相比,它实现了快速和高质量的生成,并提高了零样本编辑的灵活性。由于最优传输(OT)的好处,我们的方法不受先验分布的限制,使得非配对的图像到图像(I2I)转换成为可能,并且相比其他零样本编辑方法,可编辑空间增加了一倍(在轨迹的起点和终点都增加)。就质量而言,COT Flow 可以在一步中生成具有竞争力的结果,而以前的最先进的非配对图像到图像(I2I)翻译方法需要多步。为了通过引入OT来突出COT Flow的优点,我们引入了COT Editor,以实现具有优秀灵活性和质量的用户引导编辑。代码将在https://github.com/zuxinrui/cot_flow发布。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决扩大数据生成和编辑空间以及提高生成速度的问题。同时,该方法还试图克服传统扩散模型中迭代生成过程的计算成本高和速度慢的问题。
  • 关键思路
    本文提出了一种新的方法Contrastive Optimal Transport Flow (COT Flow),通过优化传输(OT)实现快速高质量的生成,并且相比之前的扩散模型,具有更好的零样本编辑灵活性。此外,COT Flow没有先验分布的限制,可以进行非配对图像到图像(I2I)转换。
  • 其它亮点
    本文的亮点在于使用OT来优化生成过程,提高了生成速度和零样本编辑的灵活性。实验结果表明,COT Flow能够在一步中生成具有竞争力的结果,并且可以通过COT Editor进行用户引导的编辑。代码已经在GitHub上开源。
  • 相关研究
    在最近的相关研究中,还有许多使用扩散模型进行数据生成和编辑的方法,例如DDPM和GLOW。同时,还有一些使用OT的图像生成方法,例如Monge-Ampère GAN和Sinkhorn AutoEncoder。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问