【论文标题】Objective evaluation of deep uncertainty predictions for COVID-19 detection
【作者团队】Hamzeh Asgharnezhad, Afshar Shamsi, Roohallah Alizadehsani, Abbas Khosravi, Saeid Nahavandi, Zahra Alizadeh Sani, Dipti Srinivasan & Sheikh Mohammed Shariful Islam
【发表时间】2022/01/17
【机 构】迪肯大学、新加坡国立
【论文链接】https://www.nature.com/articles/s41598-022-05052-x#citeas
深度神经网络(DNNs)已被广泛用于检测医学图像中的COVID-19。现有的研究主要应用迁移学习和其他数据表征策略来产生准确的点估计。这些网络的泛化能力总是值得怀疑的,因为它们是用小数据集开发的,而且没有报告它们的预测信心。量化与DNN预测相关的不确定性是其在医疗环境中可靠部署的先决条件。本文全面地、定量地研究了DNNs为COVID-19诊断产生可靠的不确定性估计的能力。作者首先检查了使用ImageNet和胸部X射线(CXR)图像数据集的预训练对网络性能的影响,然后在CXR预训练上引入MC-dropout(MCD)、集成和集成MC-dropout(EMCD)来量化与DNN的点预测相关的不确定性。作者提出了不确定性混淆矩阵的新概念,并引入了客观评价不确定性估计的新性能指标。定性和定量评价还显示,错误预测的不确定性估计在统计学上高于正确预测,因此不确定性量化方法能够标记出具有高不确定性估计的风险预测。利用这些新的不确定性性能指标,本文定量地证明了何时可以相信DNN对胸部X射线的COVID-19检测的预测。最后,本文所提出的新的不确定性评价指标是通用的,可用于评价所有分类问题中的概率预测。
上图展示了不确定性定量方法之一,MC Dropout的伪代码。后验的蒙特卡罗样本可以通过在测试时执行几个随机的前验(保持Dropout)来获得,输出的后验分布可以通过这种方式近似地得到,而且计算负担最小。
上图展示了不确定性定量方法之一,Ensemble的伪代码。集成网络是一组为特定任务而共同工作的网络,每个网络预测一个概率,概率的平均值将类似于最终的预测概率(后验)。
上图展示了不确定性定量方法之一,EMCD的伪代码。集成网络和MCD算法的结合产生了EMCD,这里的集成是由具有不同结构的DNN组成的,每个网络的评估都是通过使用MCD算法来完成的,即执行几个随机的前向传递,最终平均所有后验概率来估计一个单一的高斯分布。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢