关键词:深度生成模型,单细胞转录组,空间转录组,数据整合



论文题目::Integrating spatial and single-cell transcriptomics data using deep generative models with SpatialScope
论文期刊:Nature Communications
论文地址:https://www.nature.com/articles/s41467-023-43629-w

空间转录组学(spatial transcriptomics,ST)技术的迅速兴起,正在彻底改变我们对生物组织的空间结构和生物学功能的认识。尽管目前的空间转录组学方法,无论是基于第二代测序(基于序列的方法)还是荧光原位杂交(基于图像的方法),都能提供有价值的见解,但它们在细胞分辨率或转录组范围的剖析方面都面临着局限性。

为了解决这些局限性,这项研究提出 SpatialScope,一种利用深度生成模型整合单细胞转录组数据和空间转录组数据的通用方法。通过对模型和算法设计的创新,SpatialScope不仅增强了基于序列的空间转录组数据以实现单细胞分辨率,还能准确推断基于图像的空间转录组数据的全转录组表达水平。研究通过基于序列和基于图像的空间转录组方法的模拟研究和实际数据分析,证明了 SpatialScope 的实用性。SpatialScope 能以整个转录组的单细胞分辨率提供组织结构的空间特征,从而促进下游分析,包括通过配体与受体的相互作用检测细胞通讯、定位细胞亚型以及识别空间差异表达基因。

图1. SpatialScope 旨在利用深度生成模型的能力,从单细胞转录组参考数据中学习表达量分布,从而推断空间分辨的单细胞转录组。SpatialScope 的工作流程首先是量化低分辨率空间转录组数据(如 Visium)中每个点内的细胞数量。随后,它将确定点内单个细胞的细胞类型标签。最后,以推断出的细胞类型标签为条件,SpatialScope 进行基因表达分解,将像素级基因表达谱转化为单细胞级分辨率。通过这种分解,可以在单细胞水平上进行更全面、更翔实的下游分析。


图2:基准数据集下不同数据整合工具的结果描述。空间散点图显示了单细胞分辨率下的细胞类型。红色虚线表示细胞聚集产生的网格。c 柱状图显示了四种单片基准数据集(数据集 1-4)中每种方法在单细胞水平上推断细胞类型标签的错误率。d 柱状图显示了四种单片基准数据集(数据集 1-4)中每种方法在点水平推断细胞类型比例时的皮尔森相关系数(PCC)和均方根误差(RMSE)。e 柱状图显示了不同方法在不同模拟捕获率下推断四个单切片基准数据集(数据集 1-4)中每个单细胞全转录组表达水平的余弦相似度。



图3. SpatialScope 能够整合多个切片,并解释小鼠大脑皮层数据中的细胞间相互作用。(a,b) 10x Visium小鼠大脑皮层两张相邻切片的染色组织学(左)。(c) SpatialScope 使用多切片相邻信息(上)与 StarDist+RCTD 使用多切片相邻信息(下)的细胞类型鉴定结果比较(左:小鼠大脑皮层切片 1;右:小鼠大脑皮层切片 2)。(d) 顶部:SpatialScope 使用多切片确定的 L4、L5 IT、L6b/L6 CT/L6 IT、Oligo 和 VLMC 的空间细胞位置。中间:原始 Visium 数据中相应细胞类型特异性标记基因的点级表达水平。底部:SpatialScope 精炼的相应标记基因的单细胞分辨率表达水平。(e) SpatialScope 生成的三维对齐单细胞分辨率空间分辨转录组数据中检测到的一些代表性分子相互作用的可视化。散点图显示了配体-受体对在相应细胞类型对中的表达水平。配体和受体的表达分别用橙色和绿色表示。L 细胞类型表达配体基因,R 细胞类型表达受体基因。




编译|郭瑞东

大模型与生物医学:

AI + Science第二季读书会启动



详情请见:

大模型与生物医学:AI + Science第二季读书会启动



推荐阅读

1. Nature通讯:通过深度生成网络对单细胞转录数据进行双曲嵌入
2. PNAS前沿:概率密度估计的深度生成神经网络方法
3. 深度图生成模型综述:5类模型及前景(附PDF下载)
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5成为集智VIP,解锁全站课程/读书会
6. 加入集智,一起复杂!


点击“阅读原文”,报名读书会

内容中包含的图片若涉及版权问题,请及时与我们联系删除