A Mathematical Introduction to Diffusion Models

2026年07月02日
  • 简介
    本讲义从采样视角出发,以证明为导向,系统性地介绍了扩散模型,其内容贯穿一条清晰脉络:从经典的采样动力学出发,延伸至当代扩散采样器,进而涵盖其误差分析与推理阶段的调控方法。全篇内容分层组织:核心定义与恒等式均给出完整证明;代表性估计则在简化假设下予以严格推导;而面向前沿研究的定理则辅以清晰的证明思路导引。本书面向刚进入研究生阶段的学习者,要求读者具备概率论基础,但无需预先掌握随机微分方程、随机数值方法或扩散模型的相关知识。
  • 作者讲解
  • 图表
  • 解决问题
    如何从采样动力学的第一性原理出发,为现代扩散模型构建一个严格、分层、教学友好的理论框架,弥合经典随机采样理论(如Langevin动力学)与前沿扩散采样器(如DDIM、DPM-Solver)之间的证明鸿沟,并系统刻画其离散化误差与推理时可控性;该问题在教学与理论可解释性层面具有新颖性——此前缺乏面向初学者、不预设SDE背景、以采样为核心视角的统一证明性导引。
  • 关键思路
    以确定性/随机采样轨迹的连续极限为统一主线,将扩散采样重构为‘逆向流’的数值求解问题:从Fokker–Planck方程与得分匹配的等价性出发,严格推导前向与逆向SDE,再通过变步长离散化分析(如显式欧拉 vs. 隐式中点)建立误差界,并将推理时控制(如classifier-free guidance、step scheduling)自然嵌入到离散化方案的选择与修正项设计中;新意在于放弃黑箱建模视角,转而将所有主流采样器视为同一逆向流的不同数值积分策略。
  • 其它亮点
    采用三层教学结构:核心恒等式(如得分函数与对数梯度关系)全部给出完整证明;关键误差估计(如DPM-Solver一阶收敛性)在Lipschitz+bounded-Hessian假设下给出简洁推导;前沿定理(如带自适应步长的强收敛阶提升)仅陈述并提供证明逻辑图;无实验(纯理论导引),未使用数据集或代码;亮点在于完全避免SDE先验知识,所有概念由概率密度演化与ODE/SDE数值分析自然引出;值得深入的方向包括:非Lipschitz得分下的稳定性分析、离散化误差与生成质量的经验关联建模、以及基于此框架的新型可控采样器设计。
  • 相关研究
    《Denoising Diffusion Implicit Models》(DDIM, 2021); 《Elucidating the Design Space of Diffusion-Based Generative Models》(EDM, 2022); 《Score-Based Generative Modeling through Stochastic Differential Equations》(Song et al., 2021); 《DPM-Solver: A Fast ODE Solver for Diffusion Sampling》(Lu et al., 2022); 《Convergence Analysis of Denoising Diffusion Probabilistic Models》(De Bortoli et al., 2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问