介绍宾西法尼亚大学的Mingyao Li老师发表在Nature methods的一篇论文“SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network”。本文提出了一种基于GCN的方法来同时考虑空间域和空间可变基因(SVG)识别两个问题。SpaGCN 首先通过构建表示数据空间依赖性的无向加权图来整合基因表达、空间位置和组织学来识别空间域,之后对于每个空间域检测域中丰富的SVG。

文章地址:

https://www.nature.com/articles/s41592-021-01255-8

代码地址:

https://github.com/jianhuupenn/SpaGCN

空间分辨转录组(SRT)技术的最新进展已经能够在组织微环境下全面描述基因表达模式。为了阐明空间基因表达变异,作者提出了SpaGCN,通过在SRT数据分析中整合基因表达、空间位置和组织学的图卷积网络方法。通过图卷积,SpaGCN从相邻点聚合每个点的基因表达,从而能够识别具有连贯表达和组织学的空间域。随后的域引导差异表达(DE)分析然后检测在已识别域中具有丰富表达模式的基因。作者使用SpaGCN分析了七个SRT数据集,表明它相比竞争方法可以检测出更加丰富的空间表达模式的基因。此外,SpaGCN检测到的基因是可迁移的,可用于研究其他数据集中基因表达的空间变化。

SpaGCN架构图

SpaGCN首先建立了一个图来表示所有点之间的空间位置和组织学信息的关系。接下来,SpaGCN利用一个图卷积层来聚合相邻点的基因表达信息。然后使用聚合表达式矩阵对点进行无监督迭代聚类。每个聚类都被认为是一个空间域,然后SpaGCN通过DE分析检测在一个域中富集的空间可变基因(SVG)。