由于深度学习任务往往依赖于大量的标注数据,医疗图像的样本标注又会涉及到较多的专业知识,标注人员需要对病灶的大小、形状、边缘等信息进行准确的判断,甚至需要经验丰富的专家进行两次以上的评判,这增加了深度学习在医疗领域应用的难度。

目前,虽然有一些公开可用的数据集(如LIDC-IDRI、LUNA等),但是这些公开数据集存在图像数量少,偏倚度高的问题,导致模型不可避免地出现过拟合。为了解决该问题,一般会借助迁移学习使用ImageNet等大规模数据集上的预训练参数加快模型的收敛;然而,对于3D医学图像(例如CT、MRI等),目前并没有很好的3D模型预训练参数。

今天为大家介绍一篇针对3D医学影像中病灶检测任务的研究,该研究针对CT层面中的2D病灶检测问题提出了一种可以有效利用3D上下文信息的新框架MP3D,同时提出了一种预训练3D卷积神经网络的新思路。

文章发表于MICCAI 2020 [1],该研究在迄今规模最大的CT图像数据集NIH DeepLesion上进行了实验,取得了SOTA的病灶检测结果。当Sensitivity@0.5FPs,相比当前SOTA方法提升3.48%,而相比2.5D的baseline方法,提升高达4.93%

此外,实验还表明文中提出的有监督预训练方法可以有效提升3D模型训练的收敛速度,以及在小规模数据集上的模型精度。研究者在四个基准的3D医学数据集上进行了大规模的实验验证,结果表明对我们的预训练3D模型进行调优(finetune)不仅可以显著优于从头训练(training from scratch)的3D模型,而且与现有的最先进的自监督和全监督预训练模型相比,我们的模型效果在多数任务上也都具有明显优势。

论文链接:

https://arxiv.org/pdf/2012.08770.pdf

预训练相关的代码以及基于ResNet3D-18的预训练模型已经公开,链接为:

https://github.com/urmagicsmine/CSPR

图1:MP3D网络框架

图2:基于变维度转换的3D模型预训练

内容中包含的图片若涉及版权问题,请及时与我们联系删除