Survival modeling using deep learning, machine learning and statistical methods: A comparative analysis for predicting mortality after hospital admission

2024年03月04日
  • 简介
    生存分析对于研究时间至事件结果以及提供随时间发生事件概率的动态理解至关重要。各种生存分析技术,从传统的统计模型到最先进的机器学习算法,都支持医疗保健干预和政策决策。然而,它们的比较性能仍在进行讨论。我们进行了几种生存分析方法的比较研究,包括Cox比例风险(CoxPH)、逐步CoxPH、弹性网惩罚Cox模型、随机生存森林(RSF)、梯度提升机(GBM)学习、AutoScore-Survival、DeepSurv、基于神经网络的时间依赖Cox模型(CoxTime)和DeepHit生存神经网络。我们应用协调指数(C-index)来评估模型的拟合程度,积分Brier得分(IBS)来进行校准,并考虑模型的可解释性。作为一个案例研究,我们对2017年至2019年期间通过三级医院急诊科入院的患者进行了回顾性分析,基于患者人口统计学、临床病理特征和历史数据预测了90天全因死亡率。C-index的结果表明,深度学习取得了可比较的性能,其中DeepSurv产生了最好的区分度(DeepSurv: 0.893;CoxTime: 0.892;DeepHit: 0.891)。DeepSurv的校准(IBS: 0.041)表现最佳,其次是RSF(IBS: 0.042)和GBM(IBS: 0.0421),均使用全变量。此外,AutoScore-Survival使用最小的变量子集,易于解释,并能实现良好的区分度和校准(C-index: 0.867;IBS: 0.044)。虽然所有模型都令人满意,但DeepSurv表现出最佳的区分度和校准。此外,AutoScore-Survival提供了一个更简洁的模型和出色的可解释性。
  • 图表
  • 解决问题
    比较不同生存分析方法在预测患者90天全因死亡率方面的表现,并探讨它们的可解释性。
  • 关键思路
    使用多种生存分析方法进行比较研究,包括传统的统计模型和先进的机器学习算法。使用C-index评估模型的拟合程度和IBS评估校准程度,并考虑模型的可解释性。结果表明,DeepSurv表现最佳,而AutoScore-Survival则提供了更简洁的模型和优秀的可解释性。
  • 其它亮点
    使用多种模型进行比较研究,包括传统的统计模型和先进的机器学习算法,以预测患者90天全因死亡率。使用C-index评估模型的拟合程度和IBS评估校准程度,并考虑模型的可解释性。结果表明,DeepSurv表现最佳,而AutoScore-Survival则提供了更简洁的模型和优秀的可解释性。
  • 相关研究
    近期的相关研究包括: 1. "A comparison of machine learning methods for survival analysis based on microarray data: a simulation study." 2. "A review of deep learning in medical imaging: Image traits, technology trends, case studies with progress highlights, and future promises."
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论