DRUGAI

细胞间通信(Cell‒cell communication, CCC)是维持生物系统协调运作的基本过程。越来越多证据表明,同一类型或簇群的细胞在不同微环境中可能呈现出差异化的互作模式,然而现有方法多在细胞类型或簇群层面推断CCC,忽视了利基异质性。研究人员在此提出STCase工具,可基于空间转录组数据在单细胞/空间点层面解析CCC事件。STCase结合具可解释性的多视图图神经网络,并通过CCC感知注意力机制识别细胞类型对应的利基空间及其特异性通信事件。结果表明,STCase优于现有方法,能准确捕捉人支气管腺体中已知的免疫相关CCC事件,并识别出口腔鳞状细胞癌中三种传统方法难以区分的利基类型及其潜在影响预后结果的通信特征。

细胞间通信(Cell–cell communication, CCC)在维持稳态和平衡外部刺激响应中起着关键作用。细胞间的互作通常通过“发送者”细胞分泌配体,并与“接收者”细胞表面的受体结合,从而激活特定的信号通路来实现。近年来,研究人员基于单细胞转录组数据开发了多种CCC推断方法,如 CellChat、CellphoneDB、ICELLNET 和 NicheNet 等。然而,CCC事件更可能发生在邻近细胞之间,而传统单细胞数据缺乏空间位置信息,这将引入较多的假阳性,从而影响方法的可靠性。


空间转录组(Spatial Transcriptomics, ST)技术能够同时捕捉细胞的基因表达特征与空间位置信息,为CCC研究带来了显著优势。目前已有多个基于ST的CCC推断方法被提出,尽管这些方法在推断准确性方面有所提升,但大多仍聚焦于全局层面的细胞类型间互作,忽视了同一细胞类型在不同微环境中的功能差异。事实上,处于不同“生态位”(niche)中的同类细胞可能存在显著差异的通信事件,调控其各自的功能。


部分新兴方法虽尝试在单细胞/空间点层面解析CCC事件,但尚未系统性地根据通信信息识别生态位,并进一步筛选其中的关键功能性通信事件。此外,已有方法在对细胞亚群聚类时多依赖基因表达、空间位置或组织结构等特征,而忽略了细胞之间的互作关系对生态位划分的重要性。


为此,研究人员提出了 STCase 方法,旨在实现单细胞/空间点分辨率下CCC事件的精准推断,并将此信息纳入细胞类型的亚群聚类过程,从而识别具有不同通信功能的生态位。STCase 利用可解释的多视图图神经网络(GNN)特性,进一步揭示功能性生态位特异的CCC事件。


结果

模型概述

研究人员开发的 STCase 方法包括两个主要模块。

第一个模块在单细胞/空间点层面识别候选CCC事件。该模块整合了配体–受体对(LRP)激活的转录因子(TF)及其下游靶基因的细胞内信号路径,用于提高事件推断的准确性。其流程包括四步:(1)整合配体和受体的表达信息,结合配体扩散效应计算初始CCC得分;(2)通过置换检验去除不显著的CCC事件;(3)利用 SCENIC 方法计算下游TF的激活得分;(4)将初始CCC得分与TF激活得分进行整合,可选择宽松或严格模式:前者在缺乏TF激活时仍保留LRP,后者则将其滤除。


为保证推断可靠性,研究人员还构建了高置信度的LRP数据库(STCaseDB),该数据库整合多方信息并多轮筛选,同时关联了每对LRP的下游TF。


第二个模块基于整合后的CCC得分进行细胞类型的亚群聚类及生态位特异的CCC事件识别。其流程包括:(1)构建多视图图神经网络,其中每一视图对应一个LRP,图结构基于空间邻接图并整合空间坐标与基因表达数据;(2)将CCC得分乘以LRP权重作为边权,训练自编码器风格模型,学习潜在表示;(3)通过内积解码并迭代优化,尽可能重建原始空间邻接图;(4)利用学习到的潜在表示和LRP权重进行生态位导向的细胞亚群聚类及功能性通信事件识别。


在训练过程中,每个LRP权重为可学习参数,代表其在聚类中的贡献。通过GNN完成细胞聚类后,可进一步分析各LRP的权重,从而识别出不同空间位置下对同类细胞产生不同影响的通信事件。最终,STCase还提供多种可视化工具辅助结果解释。

STCase 方法性能评估

为全面评估 STCase 的性能,研究人员构建了基准测试流程,将其与十种已有方法进行了对比。通过定义细胞类型间通信事件的重叠率,设定高置信事件的判定标准,并据此计算虚假阳性率和准确通信事件数量。为避免数据库和数据集带来的偏倚,研究人员统一采用 CellChatDB 数据库,并在来自人类肺、肾、乳腺癌、黑色素瘤以及小鼠下丘脑区域的五个 ST 数据集上进行测试。结果显示,STCase 在降低虚假阳性率和提高准确事件识别数量方面表现最优。


此外,为验证 STCase 的稳健性,研究人员在六个来自人类支气管的 ST 数据集上推断 CCC 事件,发现约 75.6% 的事件在所有数据集中均被识别,88.99% 出现在至少四个数据集中。大部分数据集之间的CCC得分相关性超过 0.8,显示其对个体差异具有一定的敏感性。


在生态位导向的细胞亚群聚类方面,研究人员基于人类皮肤鳞状细胞癌(cSCC)单细胞数据模拟三种不同分辨率的 ST 数据,并利用 STCase 成功将癌细胞划分为不同生态位。在单细胞分辨率数据中,准确率和 F1 分数分别约为 0.9 和 0.8;在非单细胞分辨率下表现更加稳定,优于仅依赖基因表达的聚类方法。


在识别生态位特异 CCC 事件方面,STCase 可提取多视图 GNN 中学习得到的 LRP 权重,并通过置换检验识别与特定生态位显著关联的事件。这些候选事件的显著性远高于其他 LRP,表明 STCase 能有效识别关键生态位通信事件。


捕捉人类支气管中的免疫相关通信事件

研究人员将 STCase 应用于人类支气管 ST 数据集,发现识别的通信事件主要集中在组织结构内部,表现出良好的空间一致性,尤其在腺体区域最为显著。富集的通路多与细胞外基质相关,且配体和受体的空间共表达进一步支持其局部通信功能。此外,STCase 成功识别了先前研究已验证的 MHC-II、CCL-CCR、IL-6 和 APRIL 四条免疫相关通路,识别到的下游转录因子如 RELA 等也与文献一致。


揭示肿瘤细胞的生态位异质性

在口腔鳞状细胞癌(OSCC)数据中,STCase 将 SCC 点划分为三种生态位:邻近淋巴细胞阳性间质(LPS)、阴性间质(LNS)和核心区域。与传统方法相比,STCase 的聚类结果更具空间一致性和生物学意义。后续分析显示,LNS 区富含肿瘤相关成纤维细胞(CAF),LPS 区则以 T 细胞为主。


各亚群表达的基因分别富集于 TGF-β 通路(SCC_LNN)与趋化因子通路(SCC_LPN),相应通信事件的发送者权重也显示出一致性。此外,SCC_LNN、SCC_LPN 和 SCC_Core 在上皮-间质转化、干扰素反应和鳞状基因模块方面具有显著差异,这些特征基于基因表达聚类难以捕捉。生存分析结果进一步指出,SCC_LNN 相关表达特征预示较差预后,而 SCC_LPN 表现出更好的预后倾向。

鉴定 SCC_LNN 的生态位特异通信事件

研究人员进一步识别 SCC_LNN 所特有的通信事件,并发现其富集于肿瘤侵袭、转移和血管生成等相关通路。其中,PERIOSTIN 和 THBS 通路尤为显著,可能通过激活 PI3K-Akt 通路增强肿瘤的恶性特征。生存分析也表明 POSTN 和 THBS1 的高表达与差预后显著相关。


应用于猕猴皮层的单细胞 ST 数据

为验证 STCase 的可拓展性,研究人员将其应用于基于 Stereo-seq 的猕猴皮层 ST 数据,成功识别出不同皮层层中少突胶质细胞(OLGs)的生态位差异,并揭示 NRG1/ErbB 通路在深层皮层的活跃通信,提示其在髓鞘形成和有氧糖酵解中的重要作用。聚类结果显示 STCase 在空间层次结构的区分上优于 CellCharter 和 SpatialDE2。


讨论

研究人员预期,STCase 将在多种生理和病理情境下挖掘具有生物学意义的细胞间通信(CCC)事件中发挥重要作用。尽管 STCase 在多个方面展现出良好表现,但仍存在一些需进一步改进的局限性。


首先,STCase 所识别的通信事件依赖于已知配体–受体对(LRPs)的整合,因此无法捕捉尚未发表或未知的LRP对。其次,该方法默认基因表达水平可以代表蛋白水平,可能引入偏差,影响推断的准确性。第三,虽然 STCase 通过整合 SCENIC 计算的下游转录因子(TF)激活得分以提升预测精度,但细胞内信号通路本身较为复杂,且未考虑通路间的交叉作用,可能仍存在假阳性风险。最后,针对特定生物情境中的CCC事件,仍需进一步开展实验验证以确认其生物功能。

整理 | WJM

参考资料

Qi, J., Luo, Z., Li, CY. et al. Interpretable niche-based cell‒cell communication inference using multi-view graph neural networks. Nat Comput Sci (2025). 

https://doi.org/10.1038/s43588-025-00809-6

内容中包含的图片若涉及版权问题,请及时与我们联系删除