- 简介基础模型已经开始通过作为预训练的通用骨干网络来转换图像分析,即使在后训练数据有限的情况下,也可以适应多种任务。然而,它们对空间蛋白质组学的影响仍然有限,空间蛋白质组学是一种以单细胞分辨率绘制蛋白质的地图的成像技术。在此,我们介绍了KRONOS,一种专为空间蛋白质组学构建的基础模型。KRONOS以自我监督的方式进行训练,使用了超过4700万个图像块,涵盖了175种蛋白质标记、16种组织类型和8种基于荧光的成像平台。我们引入了关键的架构调整,以应对多路成像的高维、多通道和异质性特点。我们证明了KRONOS能够学习具有生物学意义的表示,范围从细胞和微环境到组织水平,使其能够处理各种下游任务,包括细胞表型分析、区域分类和患者分层。在11个独立队列中进行评估时,KRONOS在细胞表型分析、治疗反应预测和检索任务中达到了最先进的性能,并且高度数据高效。KRONOS还引入了无需分割的补丁级处理范式,用于高效和可扩展的空间蛋白质组学分析,允许跨机构比较,并作为一个用于空间模式的图像反向搜索引擎。综上所述,这些结果确立了KRONOS作为一种灵活且可扩展的空间蛋白质组学工具的地位。该模型可在https://github.com/mahmoodlab/KRONOS公开获取。
- 图表
- 解决问题该论文试图解决如何利用基础模型(foundation model)提升空间蛋白组学图像分析能力的问题,特别是在多任务适应性和数据效率方面。这是一个相对较新的问题领域,因为尽管基础模型在其他图像分析任务中表现出色,但其在空间蛋白组学中的应用仍然有限。
- 关键思路关键思路是开发一个名为KRONOS的基础模型,通过自监督学习训练,在超过4700万张图像补丁上进行预训练,涵盖175种蛋白质标记、16种组织类型和8种荧光成像平台。为应对多通道、高维和异构的多路复用图像特性,论文提出了针对架构的改进,并引入了无分割的补丁级处理方法。相比现有方法,KRONOS能够高效学习生物意义的表示,并适用于从细胞表型到患者分层等多样化的下游任务。
- 其它亮点论文展示了KRONOS在11个独立队列上的优越性能,尤其是在细胞表型分类、治疗反应预测和检索任务中的表现。此外,它还具有高度的数据效率,能够在少量标注数据的情况下实现良好泛化。无分割的补丁级处理范式提高了计算效率和可扩展性,支持跨机构比较以及作为图像反向搜索引擎用于空间模式检索。代码已开源,位于https://github.com/mahmoodlab/KRONOS,这将促进未来研究的发展。值得进一步研究的方向包括更广泛的临床应用验证以及对更大规模数据集的支持。
- 相关研究包括:1) Seurat v4 提供的空间转录组数据分析工具;2) STARmap 和 MERFISH 等技术在单细胞分辨率下的多路复用成像研究;3) Pathology Foundation Models 探讨病理图像的基础模型;4) Spatial Transcriptomics via Transformers 使用Transformer架构处理空间转录组数据。这些工作共同推动了空间蛋白组学和多模态生物学数据分析的进步。
沙发等你来抢
去评论
评论
沙发等你来抢