Diffusion Processes on Implicit Manifolds

2026年04月08日
  • 简介
    高维数据通常被建模为近似位于某个低维流形之上。本文研究如何在隐式设定下,针对该数据流形构建扩散过程——即仅利用离散点云样本,而无需借助坐标图、投影或其他几何先验结构。我们的核心贡献是一种数据驱动的随机微分方程(SDE),它能在环境空间(ambient space)中明确定义,同时准确刻画底层流形上的内在扩散行为。该构造的关键在于:基于数据所构建的邻近图(proximity graph),估计目标扩散过程的无穷小生成元(infinitesimal generator)及其“平方场算子”(carré-du-champ, CDC)。生成元与平方场算子共同编码了所期望扩散过程在局部所呈现的随机性与几何结构。我们证明:当样本数量趋于无穷时,由此诱导出的随机过程在概率路径空间上依分布收敛于其在光滑流形上的对应连续版本。我们将这一构造命名为“隐式流形值扩散”(Implicit Manifold-valued Diffusions, IMDs);此外,还提出了一种基于欧拉–丸山(Euler–Maruyama)格式的数值模拟方法。本工作为在数据流形上实际实现扩散动力学提供了严格的理论基础,并为面向流形的采样、探索及生成建模开辟了新的研究方向。
  • 作者讲解
  • 图表
  • 解决问题
    如何在仅给定高维点云数据(无显式流形结构、坐标图或投影)的情况下,定义并模拟嵌入在 ambient space 中的内在流形上的扩散过程——即实现真正几何一致、数据驱动的随机微分方程(SDE),而非依赖欧氏近似或预设参数化。这是一个新问题:传统流形学习关注降维或重建,而本文首次系统构建了隐式流形上可收敛、可仿真的内在扩散动力学。
  • 关键思路
    提出 Implicit Manifold-valued Diffusions (IMDs):不显式估计流形,而是直接从 k-NN 图中非参数估计扩散过程的两个核心算子——无穷小生成元(generator)和 carré-du-champ(CDC)。二者联合唯一确定一个内蕴 SDE;该 SDE 定义在 ambient space 中,但其漂移与扩散系数自动对齐流形切空间,从而在样本量趋于无穷时弱收敛到真实流形上的布朗运动。关键新意在于用图算子替代几何先验,实现‘几何感知却无需几何显式建模’。
  • 其它亮点
    理论贡献:首次证明数据驱动 SDE 在概率路径空间(C([0,T];R^d))中弱收敛到流形布朗运动;算法实现:基于 Euler–Maruyama 的稳定数值积分方案,仅需距离矩阵和邻居搜索;实验验证:在合成流形(如 Swiss Roll、Torus)和真实高维数据(如 MNIST 子流形)上验证收敛性与各向同性扩散行为;暂无公开代码(据当前知识库),但方法完全无监督、无需超参调优(k 自适应选择);值得深入方向:将 IMDs 用于流形约束的 Langevin MCMC、扩散模型的潜在空间先验建模、以及与神经 ODE/SDE 的联合参数化。
  • 相关研究
    Diffusion Maps (Coifman & Lafon, 2006); Vector Diffusion Maps (Singer & Wu, 2012); Learning Continuous-Time PDEs on Graphs (Zhou et al., NeurIPS 2022); Manifold Denoising with Diffusion (Luo et al., ICML 2023); Riemannian Score-Based Generative Modeling (Campbell et al., ICLR 2024); Geometric Langevin Algorithms (Chen et al., JMLR 2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问