- 简介在急性髓系白血病(AML)中,代表和量化最小残留病(MRD)对于预后和随访AML患者至关重要。由于传统的细胞学分析无法检测低于5%的白血病细胞,因此预计流式细胞术数据集的分析将提供更可靠的结果。本文探讨了基于最优输运(OT)的统计学习方法,以实现对多患者流式细胞术测量(FCM)数据集的相关低维表示,这些数据集被视为高维概率分布。使用OT的框架,我们通过将所有数据合并为单个点云,通过均值量化来使用K均值算法进行多个大规模点云的降维。在此量化步骤之后,通过使用线性化OT的Wasserstein主成分分析(PCA)或组成数据的对数比PCA,将低维量化概率测量嵌入到线性空间中,可视化患者内部和间接FCM变异性。使用公开可用的FCM数据集和来自波尔多大学医院的FCM数据集,我们展示了我们的方法优于流行的核均值嵌入技术,用于从多个高维概率分布进行统计学习的好处。我们还强调了我们的方法对于根据AML中MRD水平对患者测量进行低维投影和聚类的有用性。特别地,我们基于OT的方法允许将FlowSom算法的结果进行相关和信息丰富的二维表示,FlowSom是一种用于使用多患者FCM检测AML中MRD的最先进方法。
- 图表
- 解决问题本文旨在通过最优输运(OT)的统计学习方法,对多患者多维度流式细胞术(FCM)测量数据集进行低维度表示,以实现对急性髓性白血病(AML)中最小残留病变(MRD)的表征和量化。
- 关键思路本文提出了一种基于OT的K-means算法,通过合并所有数据到单个点云中的平均测量量化,实现了多个大规模点云的降维。接着,使用Wasserstein PCA或对组成数据进行对数比PCA的低维度嵌入,将量化的概率测量嵌入到线性空间中,从而进行患者FCM变异性的可视化。
- 其它亮点本文的方法优于流行的核平均嵌入技术,适用于对多个高维概率分布进行统计学习。研究人员还展示了该方法在AML中MRD水平的低维度投影和聚类中的实用性。实验使用了公开数据集和来自波尔多大学医院的FCM数据集,并说明了FlowSom算法在OT方法下的优越性。
- 最近的相关研究包括使用OT对多个高维分布进行聚类的工作,以及使用Wasserstein距离进行数据分析的研究。
沙发等你来抢
去评论
评论
沙发等你来抢