- 简介高维单细胞数据由于细胞状态的复杂性和异质性,使得识别潜在的生物学模式面临重大挑战。我们提出了一种全面的基因-细胞依赖性可视化方法,通过无监督聚类Growing Hierarchical Self-Organizing Map(GHSOM)来分析高维单细胞数据,如单细胞测序和CRISPR筛选。GHSOM应用于以层次结构聚类样本,使得聚类的自我生长结构满足所需的变化。我们提出了一种新颖的显著属性识别算法,以识别区分聚类的特征。该算法确定了具有最小变化但在聚类之间具有显著变化的属性。这些关键属性可以用于有针对性的数据检索和下游分析。此外,我们提供了两个创新的可视化工具:聚类特征图和聚类分布图。聚类特征图突出显示了GHSOM聚类层次结构中特定特征的分布。这允许基于所选特征快速视觉评估聚类的独特性。聚类分布图将叶簇呈现为GHSOM网格上的圆圈,圆圈大小反映聚类数据大小,颜色可自定义以可视化细胞类型或其他属性。我们将分析应用于三个单细胞数据集和一个CRISPR数据集(细胞-基因数据库),并使用内部和外部CH和ARI评分评估聚类方法。GHSOM表现良好,在内部评估中表现最佳(CH=4.2)。在外部评估中,GHSOM是所有方法中排名第三的最佳表现者。
- 图表
- 解决问题如何处理高维单细胞数据的复杂性和异质性,以识别潜在的生物模式?
- 关键思路提出一种基于Growing Hierarchical Self-Organizing Map (GHSOM)的无监督聚类方法,用于高维单细胞数据的可视化和分析。使用新颖的算法来确定区分不同聚类的关键特征,并提供两个可视化工具:Cluster Feature Map和Cluster Distribution Map。
- 其它亮点在三个单细胞数据集和一个CRISPR数据集上进行了实验,使用内部和外部评估方法评估了聚类方法的性能。GHSOM在内部评估中表现最好,在外部评估中排名第三。研究还提供了可供使用的开源代码。
- 最近的相关研究包括:'Single-cell RNA-seq data clustering using self-organizing maps','Unsupervised clustering of single-cell RNA-seq data using differential expression analysis','Deep learning for single-cell analysis'等。
沙发等你来抢
去评论
评论
沙发等你来抢