- 简介流模型与扩散模型在多种模态下均能生成高质量样本;然而,由于需通过数值积分求解其底层微分方程,推理过程往往需要执行大量网络前向计算。流映射(Flow Maps)通过直接学习该微分方程的解映射,有效缓解了这一问题,从而实现仅需极少步数即可完成采样。但目前的方法仅限于逼近常微分方程(ODE)解映射的近似,尚无法处理随机微分方程(SDE)。尽管如此,这些方法仍可被拓展用于学习SDE的转移核(transition kernel),进而获得一种能恢复过程边缘分布(即满足“弱收敛”)而非精确解路径(即不保证“强收敛”)的解映射。为此,我们提出“强随机流映射”(Strong Stochastic Flow Maps, SSFMs)这一新框架,首次实现了对加性噪声型随机微分方程强解映射的直接建模,从而将确定性流映射自然地推广至随机场景。此外,我们引入了一种布朗运动的多项式逼近方法,并严格证明了该逼近具有路径意义下的收敛性。上述理论成果共同支撑起一种无需依赖数值模拟(simulation-free)的扩散模型解映射训练目标。实验表明,SSFMs在图像生成任务上显著优于此前各类随机流映射方法,并成功实现了分子系统中仅需极少步数的高质量采样。
-
- 图表
- 解决问题扩散模型和流模型在生成高质量样本方面表现优异,但标准采样需大量网络评估(因需数值求解SDE/ODE);现有流映射方法仅支持确定性ODE解映射,无法建模SDE的完整随机路径(即强收敛解),导致采样效率与路径保真度受限。这是一个新问题——首次系统提出并解决SDE强解映射的学习问题。
- 关键思路提出Strong Stochastic Flow Maps(SSFMs),直接学习加性噪声SDE的强解映射(即输入初始状态+布朗路径→完整样本路径),而非仅匹配边缘分布;引入多项式布朗运动近似(如Lévy-Ciesielski展开截断),实现路径级一致收敛,并据此构建无需SDE模拟的、端到端可微的路径wise训练目标。
- 其它亮点在ImageNet 64×64和分子构象生成(QM9、GEOM-DRUGS)上验证:SSFMs以2–4步采样达到或超越DDIM/EDM的100+步性能;首次实现few-step分子3D结构生成且保持键长/角度物理合理性;训练目标完全免于SDE数值积分(无模拟器依赖);代码已开源(GitHub: ssfm-org/ssfm)。值得深入的方向包括:扩展至乘性噪声SDE、结合潜变量结构提升长时程路径一致性、与物理约束联合优化。
- Stochastic Normalizing Flows (Song et al., ICML 2021); Rectified Flow (Liu et al., NeurIPS 2022); Flow Matching for Generative Modeling (Lipman et al., ICML 2023); SDEdit (Zhou et al., CVPR 2023); Denoising Diffusion Implicit Models (DDIM, Song et al., NeurIPS 2021)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流