【论文标题】Survival prediction of head and neck squamous cell carcinoma using machine learning models

【作者团队】Saurav Mandal, Akshansh Gupta, Waribam Pratibha Chanu

【发表时间】2021/05/16

【机 构】贾瓦哈拉尔·尼赫鲁大学,印度

【论文链接】https://arxiv.org/pdf/2105.07390.pdf

【推荐理由】本文出自贾瓦哈拉尔·尼赫鲁大学,针对于头颈部鳞状细胞癌(HNSCC)的癌症存活预测问题,本文基于多重分形波动分析(MFDFA)算法,搭建机器学习模型,通过实验表明XGBoost是最佳模型分类器。

 

头颈部鳞状细胞癌(HNSCC)是最令人痛苦的一种癌症,可导致急性疼痛,影响言语和主要的生存功能,例如吞咽和呼吸。 HNSCC患者的发病率和死亡率没有明显改善,即使在外科手术和放疗治疗方面取得了进步也是如此。高死亡率可能归因于临床结果的复杂性和重大变化。因此,重要的是提高预测癌症存活结果的准确性。迄今为止,很少有人提出HNSCC的癌症生存预测模型。在这项研究中,将基因组数据(整个外显子组测序)与临床数据整合在一起,以改善预测模型的性能。使用多重分形波动分析(MFDFA)算法处理每个患者的体细胞突变,并包括分形维数(Dq)的参数值以及用于癌症存活预测的临床数据。特征排名证明,新设计的特征是预测模型中的重要特征之一。为了提高模型的性能指标,还对所有考虑的分类器中的超参数进行了调整。实施了10倍交叉验证,XGBoost(98%的AUROC,94%的精度和93%的召回率)被证明是最佳的模型分类器,其次是Random Forest 93%的AUROC,93%的精度和93%的召回率),支持向量机(84%的AUCROC,79%的精确度和79%的召回率)和Logistic回归(80%的AUROC,77%的精确度和76%的召回率)。

 

 

图1 用于癌症生存预测的机器学习工作流程

内容中包含的图片若涉及版权问题,请及时与我们联系删除