scAGC: Learning Adaptive Cell Graphs with Contrastive Guidance for Single-Cell Clustering

2025年08月07日
  • 简介
    准确的细胞类型注释是分析单细胞RNA测序(scRNA-seq)数据的关键步骤,该数据为研究细胞异质性提供了重要见解。然而,由于scRNA-seq数据具有高维度和大量零值元素的特性,传统的聚类方法面临显著的统计和计算挑战。尽管一些先进方法利用图神经网络来建模细胞之间的关系,但它们通常依赖于静态图结构,对噪声敏感,并且难以捕捉单细胞群体中固有的长尾分布特性。 为解决这些局限性,我们提出scAGC,这是一种在对比学习引导下学习自适应细胞图的单细胞聚类方法。我们的方法以端到端的方式同时优化特征表示和细胞图结构。具体而言,我们引入了一种拓扑自适应的图自编码器,利用可微分的Gumbel-Softmax采样策略,在训练过程中动态优化图结构。这种自适应机制通过促进更平衡的邻域结构,缓解了图中节点度分布的长尾问题。 为了更好地建模scRNA-seq数据中离散、过分散和零膨胀的特性,我们将零膨胀负二项分布(ZINB)损失集成到模型中,以实现鲁棒的特征重建。此外,我们还引入了对比学习目标函数,用于规范图学习过程,防止图拓扑结构发生剧烈变化,从而提升稳定性并加快收敛速度。 在9个真实scRNA-seq数据集上的全面实验表明,scAGC始终优于其他最先进的方法,在9个数据集中的NMI指标和7个数据集中的ARI指标上均取得了最佳成绩。我们的代码可在匿名GitHub页面获取。
  • 作者讲解
  • 图表
  • 解决问题
    准确的细胞类型注释是分析单细胞RNA测序(scRNA-seq)数据的关键步骤,但由于数据的高维度和零元素的普遍存在,传统聚类方法面临统计和计算上的显著挑战。此外,现有的一些利用图神经网络的方法依赖于静态图结构,容易受到噪声影响,无法有效捕捉单细胞群体中的长尾分布。
  • 关键思路
    论文提出scAGC,一种基于对比引导的单细胞聚类方法,能够学习自适应的细胞图谱。该方法通过拓扑自适应图自编码器结合可微分Gumbel-Softmax采样策略,在训练过程中动态优化图结构,并引入对比学习目标来稳定图学习过程,同时优化特征表示和图结构。
  • 其它亮点
    1. 通过动态调整图结构缓解长尾度分布问题,促进更平衡的邻域结构。 2. 结合零膨胀负二项(ZINB)损失建模scRNA-seq数据的离散性、过分散性和零膨胀特性。 3. 引入对比学习目标,提高图学习的稳定性与收敛性。 4. 在9个真实scRNA-seq数据集上全面验证,scAGC在NMI和ARI指标上分别在9和7个数据集上表现最优。 5. 代码已开源,便于复现和后续研究。
  • 相关研究
    1. scGNN: a graph neural network approach for single-cell RNA-seq data clustering. 2. GraphSC: graph-based semi-supervised learning for single-cell clustering. 3. scGCN: a graph convolutional network for single-cell clustering. 4. SAVER: statistical methods for single-cell RNA-seq data recovery. 5. Seurat: a widely used toolkit for single-cell genomics.
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问