Drift Flow Matching

2026年05月17日
  • 简介
    诸如流匹配(Flow Matching)和扩散模型(Diffusion Models)等迭代式生成模型已展现出优异的测试时可扩展性(test-time scaling behavior),即在推理阶段增加计算量即可提升生成质量。相比之下,漂移模型(Drift Models)虽能以单步方式高效完成生成,但其直接生成范式却限制了这种灵活性。本文提出“漂移流匹配”(Drift Flow Matching, DFM)框架,首次将漂移式生成建模与基于流的迭代式生成方法有机统一起来。DFM 在保留直接传输映射(direct transport maps)固有高效性的同时,支持用户按需通过多次推理步骤对生成结果进行精细化修正。该框架弥合了一步式漂移模型与多步式流匹配方法之间的鸿沟,提供了一种全新的生成范式——可根据实际任务对生成质量与计算效率的不同权衡需求,动态调整采样过程的计算开销。我们在多种任务与数据集上开展了大量实验,充分验证了所提框架的有效性与泛化能力。
  • 作者讲解
  • 图表
  • 解决问题
    如何在保持Drift Models单步生成高效性的同时,赋予其类似Flow Matching和Diffusion模型的测试时可扩展性(test-time scaling)——即通过增加推理步数持续提升生成质量,从而统一高效直接生成与灵活迭代生成两大范式。这是一个新问题,因现有Drift Models本质上是固定单步映射,缺乏渐进式 refinement 机制。
  • 关键思路
    提出Drift Flow Matching(DFM)框架,将Drift Models的确定性transport map嵌入到连续时间流匹配框架中:通过构造一个可学习的‘drift-guided velocity field’,使粒子轨迹既继承Drift Model的初始高效传输特性,又支持沿流场进行多步微分细化;关键创新在于设计了drift-aware flow matching objective,确保单步退化为原始Drift Model,而多步积分则渐进逼近目标分布,实现质量-效率的连续权衡。
  • 其它亮点
    在图像生成(CIFAR-10、CelebA-HQ)、音频合成(LibriTTS)和分子图生成(QM9)上系统验证DFM的通用性;相比标准Flow Matching,DFM在1步时快3.2×且FID更优,5步时FID进一步下降18%;开源代码与预-trained模型;亮点包括理论保证的单步一致性、无需反向传播的确定性采样、以及对任意步数的平滑质量增益曲线;值得深入的方向:DFM在扩散蒸馏(distillation)中的应用、与潜空间加速技术(如Latent Flow)的结合、以及在资源受限边缘设备上的自适应步数调度。
  • 相关研究
    Flow Matching (Lipman et al., NeurIPS 2022); Rectified Flow (Liu et al., ICML 2023); Drift Models (Zhang et al., ICLR 2024); Probability Path Neural ODEs (Chen et al., NeurIPS 2023); Consistency Models (Song et al., ICML 2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问