Histopathological Image Classification with Cell Morphology Aware Deep Neural Networks

2024年07月11日
  • 简介
    组织病理学图像广泛用于疾病(肿瘤)组织和患者治疗选择的分析。虽然大多数显微镜图像处理以前是由病理学家手动完成的,但是最近计算机视觉的进步使得深度学习为基础的解决方案能够准确识别病变区域。然而,这样的模型通常需要大量标注的数据集进行训练,而在考虑的任务中,可用患者数据样本数量非常有限,这是经常出现的问题。为了解决这个问题,我们提出了一种新颖的DeepCMorph模型,预先训练以学习细胞形态并识别大量不同的癌症类型。该模型由两个模块组成:第一个模块执行细胞核分割并注释每种细胞类型,它是在8个公开可用的数据集的组合上进行训练,以确保其高通用性和鲁棒性。第二个模块将获得的分割图与原始显微镜图像相结合,并针对下游任务进行训练。我们在由7175名患者的8736张诊断幻灯片中提取的超过270K个组织块的泛癌症TCGA数据集上预先训练了这个模块。所提出的解决方案在考虑的数据集上实现了新的最先进性能,检测到32种癌症类型,准确率超过82%,比所有先前提出的解决方案高出4%以上。我们证明了所得到的预训练模型可以很容易地在较小的显微镜数据集上进行微调,与当前最佳解决方案和以ImageNet权重初始化的模型相比,产生了更好的结果。本文提供的代码和预训练模型可在以下网址获得:https://github.com/aiff22/DeepCMorph。
  • 图表
  • 解决问题
    本论文旨在解决组织病理学图像分析中数据集有限的问题,提出了一种基于深度学习的模型DeepCMorph,用于细胞形态学学习和癌症类型识别。
  • 关键思路
    DeepCMorph模型由两个模块组成,第一个模块用于细胞核分割和细胞类型注释,使用8个公共数据集进行训练以确保其高泛化性和鲁棒性。第二个模块将分割图与原始显微镜图像结合,用于下游任务。该模型在Pan-Cancer TCGA数据集上进行了预训练,并取得了82%以上的准确率,比之前的解决方案高出4%以上。
  • 其它亮点
    论文的亮点包括:在公共数据集上训练的第一个模块具有高泛化性和鲁棒性;在Pan-Cancer TCGA数据集上进行的预训练模型在识别32种癌症类型方面取得了新的最高性能;该模型可以轻松地在较小的显微镜图像数据集上进行微调,比当前最佳解决方案和使用ImageNet权重初始化的模型表现更好。论文提供了代码和预训练模型,并且开源。
  • 相关研究
    与该论文相关的研究包括:使用深度学习进行组织病理学图像分析的研究,以及使用预训练模型进行微调的研究。相关论文包括:“Deep learning-based histopathologic assessment of kidney tissue”和“Transfer learning with convolutional neural networks for classification of abdominal ultrasound images”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论