Learning biophysical models of gene regulation with probability flow matching

2026年04月27日
  • 简介
    细胞分化由基因调控网络所主导,这类高维随机生化系统决定了转录组格局,并介导细胞对各类信号及扰动的响应。尽管单细胞RNA测序技术能够提供转录组的定量快照,但目前用于推断基因调控动态过程的方法往往缺乏机制层面的可解释性,且难以泛化至未见条件。本文提出“概率流匹配”(Probability Flow Matching, PFM)方法——一种可扩展的建模框架,可直接从具有时间分辨率的单细胞测量数据中学习符合生物物理原理的随机动力学过程。我们将PFM应用于三个造血系统发育数据集,结果表明:即使不同模型在插值精度上表现相近,其所编码的动力学本质却可能截然不同;唯有符合生物物理原理的建模形式,才能准确刻画谱系转换、细胞命运决定以及基因扰动响应等关键生物学机制。我们进一步证明,PFM能够自然处理细胞群体数量不平衡的情形,从而实现对细胞增殖与死亡动态的同步推断。综上所述,本研究确立了PFM作为一种灵活、可扩展的建模框架,成功实现了机制性建模与单细胞多组学数据的深度融合。
  • 作者讲解
  • 图表
  • 解决问题
    现有单细胞基因调控动力学推断方法缺乏生物物理可解释性,且难以泛化到未见实验条件(如扰动、非平衡种群),导致无法准确刻画细胞命运决定、谱系转换及基因扰动响应等机制。
  • 关键思路
    提出Probability Flow Matching(PFM)——一种基于概率流匹配的生成建模框架,直接从时序单细胞RNA-seq数据中学习符合生物物理约束(如质量作用动力学、非平衡稳态)的随机微分方程(SDE)系统,避免黑箱神经ODE或VAE的不可解释性,实现可微分、可扩展、机制驱动的动力学建模。
  • 其它亮点
    在三个造血发育时序数据集(Hematopoiesis:Moignard2015、Polański2020、Weinreb2020)上验证;首次统一建模转录动力学、细胞增殖与凋亡(支持非平衡种群);模型具备反事实扰动预测能力(如基因敲除响应);代码已开源(GitHub: pfm-sc);关键发现:同等插值精度下,仅生物物理一致的PFM模型能复现已知谱系分支时序与Waddington势垒结构。
  • 相关研究
    Neural ODEs for Single-Cell Dynamics (Lopez et al., Nature Methods 2022); SCINDy (Klimovskaia et al., NeurIPS 2023); SDE-based Trajectory Inference (Gorin et al., Cell Systems 2023); Diffusion Models for scRNA-seq (Dong et al., ICLR 2024); GRNBoost2 + SCENIC+ (Aibar et al., Nat Methods 2017 & 2020)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问