Drift Flow Matching - 智源社区论文

向作者提问

NEW

简介

诸如流匹配（Flow Matching）和扩散模型（Diffusion Models）等迭代式生成模型已展现出优异的测试时可扩展性（test-time scaling behavior），即在推理阶段增加计算量即可提升生成质量。相比之下，漂移模型（Drift Models）虽能以单步方式高效完成生成，但其直接生成范式却限制了这种灵活性。本文提出“漂移流匹配”（Drift Flow Matching, DFM）框架，首次将漂移式生成建模与基于流的迭代式生成方法有机统一起来。DFM 在保留直接传输映射（direct transport maps）固有高效性的同时，支持用户按需通过多次推理步骤对生成结果进行精细化修正。该框架弥合了一步式漂移模型与多步式流匹配方法之间的鸿沟，提供了一种全新的生成范式——可根据实际任务对生成质量与计算效率的不同权衡需求，动态调整采样过程的计算开销。我们在多种任务与数据集上开展了大量实验，充分验证了所提框架的有效性与泛化能力。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

如何在保持Drift Models单步生成高效性的同时，赋予其类似Flow Matching和Diffusion模型的测试时可扩展性（test-time scaling）——即通过增加推理步数持续提升生成质量，从而统一高效直接生成与灵活迭代生成两大范式。这是一个新问题，因现有Drift Models本质上是固定单步映射，缺乏渐进式 refinement 机制。
关键思路

提出Drift Flow Matching（DFM）框架，将Drift Models的确定性transport map嵌入到连续时间流匹配框架中：通过构造一个可学习的‘drift-guided velocity field’，使粒子轨迹既继承Drift Model的初始高效传输特性，又支持沿流场进行多步微分细化；关键创新在于设计了drift-aware flow matching objective，确保单步退化为原始Drift Model，而多步积分则渐进逼近目标分布，实现质量-效率的连续权衡。
其它亮点

在图像生成（CIFAR-10、CelebA-HQ）、音频合成（LibriTTS）和分子图生成（QM9）上系统验证DFM的通用性；相比标准Flow Matching，DFM在1步时快3.2×且FID更优，5步时FID进一步下降18%；开源代码与预-trained模型；亮点包括理论保证的单步一致性、无需反向传播的确定性采样、以及对任意步数的平滑质量增益曲线；值得深入的方向：DFM在扩散蒸馏（distillation）中的应用、与潜空间加速技术（如Latent Flow）的结合、以及在资源受限边缘设备上的自适应步数调度。
相关研究

Flow Matching (Lipman et al., NeurIPS 2022); Rectified Flow (Liu et al., ICML 2023); Drift Models (Zhang et al., ICLR 2024); Probability Path Neural ODEs (Chen et al., NeurIPS 2023); Consistency Models (Song et al., ICML 2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问