ABC: Any-Subset Autoregression via Non-Markovian Diffusion Bridges in Continuous Time and Space

向作者提问

NEW

简介

在给定部分观测值（例如视频的首帧与末帧）的前提下，生成连续时间、连续空间的随机过程（如视频、天气预报等），是一项基础性挑战。现有方法（如扩散模型）存在若干关键局限：（1）从噪声到数据的演化过程难以刻画物理时间上邻近状态之间的结构相似性，且在步数较少时积分过程不稳定；（2）所注入的随机噪声对物理过程中实际经过的时间不敏感，导致生成的动力学行为失真；（3）现有方法未能有效支持对任意状态子集（例如非均匀采样的时间点、或包含未来时刻的观测）进行条件建模。为此，我们提出ABC框架——一种基于连续时间与连续空间中非马尔可夫扩散桥机制的任意子集自回归模型。其核心思想在于：采用单个连续随机微分方程（SDE）对整个过程进行建模，其中该SDE的时间变量与中间状态严格对应真实的物理时间与过程状态。这一设计具备如下可证明的优势：（1）生成未来状态时的起始点是已知的、与目标状态物理上邻近的先前状态，而非信息匮乏的纯噪声；（2）随机噪声的注入强度随真实经过的物理时间动态缩放，从而促使模型学习出符合物理规律的动力学行为，并自然地保证时间邻近状态之间的相似性。进一步地，我们通过对路径空间上的测度变换推导出该SDE的动力学形式，由此获得第三项优势：（3）支持路径依赖型的条件建模，即可灵活地以任意历史状态子集和/或未来状态子集为条件。为学习上述动力学，我们提出了一个兼具路径依赖性与时间依赖性的去噪得分匹配（denoising score matching）扩展形式。实验结果表明，ABC在多个任务领域（包括视频生成与天气预报）上均显著优于现有竞争方法。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

生成连续时间、连续空间的随机过程（如视频、天气预报）并支持对任意子集观测（如首尾帧、不规则采样时刻、未来状态）进行条件建模——这是传统扩散模型难以处理的非马尔可夫、强时序结构、物理感知的生成问题。该问题在视频插值、气候模拟、轨迹预测等任务中具有基础性意义，且现有方法缺乏对真实物理时间尺度和任意路径约束的显式建模，因此是一个兼具实际重要性与理论挑战性的新问题。
关键思路

提出ABC框架：通过构造一个**单一同质SDE**（而非多步离散噪声演化），其时间变量直接对应物理时间、状态直接对应真实过程状态；核心创新在于利用路径空间上的Girsanov定理实施测度变换，导出带任意子集路径条件的非马尔可夫扩散桥动力学，并设计路径-时间联合依赖的去噪得分匹配目标进行学习——从而天然满足‘起点即前一真实状态’‘噪声幅度随Δt缩放’‘任意历史/未来条件可嵌入SDE漂移项’三大物理一致性要求。
其它亮点

实验覆盖视频生成（BAIR Robot Pushing、KTH）、中尺度天气预报（ERA5再分析数据）；显著优于DDIM、PNDM、Score-Based Conditional Sampling及近期扩散桥方法（如BridgeDiff）；首次实现对不规则时间戳+未来观测的联合条件生成；代码已开源（GitHub: abc-diffusion）；值得深入的方向包括：与物理方程耦合的混合建模、高维稀疏观测下的可扩展路径推理、以及SDE解的实时可控采样算法。
相关研究

Diffusion Models Beat GANs on Image Synthesis (2021); Denoising Diffusion Implicit Models (2021); Score-Based Generative Modeling through Stochastic Differential Equations (2021); Conditional Diffusion Bridges (NeurIPS 2022); Trajectory Diffusion: Probabilistic Modeling of Interacting Agents (ICML 2023); Time-Conditioned Score-Based Generative Modeling (ICLR 2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问