Bayesian Networks and Machine Learning for COVID-19 Severity Explanation and Demographic Symptom Classification

2024年06月16日
  • 简介
    随着当前各种努力来对抗新型冠状病毒疫情,仍有一些不确定性有待发现,包括其传播、未来影响和复发等方面。本文提出了一个三阶段的数据驱动方法,以提取有关COVID-19的隐藏信息。第一阶段采用贝叶斯网络结构学习方法,以识别COVID-19症状和其固有人口统计变量之间的因果关系。作为第二阶段,从贝叶斯网络结构学习中得出的输出作为有用的指导,用于训练一个无监督机器学习(ML)算法,通过聚类揭示患者症状的相似性。最后一阶段利用从聚类获得的标签来训练一个人口统计症状识别(DSID)模型,该模型预测患者的症状类别和相应的人口统计概率分布。我们在美国疾病预防控制中心(CDC)获得的COVID-19数据集上应用了我们的方法。实验结果显示,与启发式ML方法的41.15%准确率相比,我们的方法测试准确率为99.99%。这强烈表明了我们的贝叶斯网络和ML方法在理解病毒症状之间的关系以及提供有关患者分层以减轻病毒严重程度的见解方面的可行性。
  • 图表
  • 解决问题
    本论文旨在通过三阶段数据驱动方法,揭示新冠病毒症状的隐藏信息,包括其传播、未来影响和复发等方面的不确定性。
  • 关键思路
    该论文采用贝叶斯网络结构学习方法识别COVID-19症状及其人口统计学变量之间的因果关系,然后使用无监督机器学习算法进行聚类,最后利用聚类结果训练DSID模型,预测患者症状类别和相应的人口统计概率分布。
  • 其它亮点
    该方法在美国疾病控制与预防中心的COVID-19数据集上表现良好,测试准确率达99.99%,远高于启发式机器学习方法的41.15%,揭示了该方法在理解病毒症状之间的关系方面的可行性。
  • 相关研究
    相关研究包括使用深度学习方法进行COVID-19病例分类和预测,以及使用机器学习方法分析COVID-19的传播和影响。例如:“COVID-19 Detection using Deep Learning: A Review”,“Machine Learning for COVID-19—Asking the Right Questions”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论