From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis

2024年08月20日
  • 简介
    最近自监督学习的进展使得新型医疗AI模型成为可能,这些模型被称为基础模型(FMs),可以从各种生物医学数据中提取健康特征。连续葡萄糖监测(CGM)提供了丰富的时间数据,但其预测更广泛的健康结果的潜力仍未得到充分利用。在这里,我们介绍了GluFormer,一种基于变压器架构的生物医学时间数据生成基础模型,并在10812名非糖尿病人的1000万个CGM测量值上进行了训练。我们对CGM训练数据进行了标记化,并使用生成式自回归的方式进行了下一个标记的预测。我们证明了GluFormer在15个不同的外部数据集上可以有效地推广,包括来自5个不同地理区域的4936个个体、6种不同的CGM设备以及几种代谢性疾病,包括正常血糖、糖尿病前期和糖尿病人群以及妊娠期糖尿病和肥胖症患者。GluFormer产生的嵌入优于传统的CGM分析工具,并在预测HbA1c、与肝脏相关的参数、血脂和睡眠指数等临床参数方面实现了高的Pearson相关性。值得注意的是,GluFormer甚至可以提前4年预测未来健康结果的发生。我们还展示了在随机临床试验(RCTs)的干预前期的CGM嵌入在预测一级和二级结果方面优于其他方法。当将饮食数据整合到GluFormer中时,我们展示了增强的模型可以准确地基于饮食摄入数据生成CGM数据,模拟饮食干预的结果,并预测个体对特定食物的反应。总的来说,我们展示了GluFormer可以准确地预测健康结果,并且可以推广到不同人群和代谢状况。
  • 图表
  • 解决问题
    论文旨在开发一个基于transformer架构的生成式基础模型GluFormer,用于预测血糖数据的健康结果,并探索其在不同人群和代谢疾病中的泛化性能。
  • 关键思路
    GluFormer使用自监督学习训练,通过预测下一个血糖值来生成CGM数据的嵌入,从而提高了传统CGM分析工具的性能。GluFormer还能够预测未来健康结果,甚至可以在RCT前期预测主要和次要结果。当与饮食数据集成时,GluFormer可以根据饮食摄入数据准确生成CGM数据,并预测个体对特定食物的反应。
  • 其它亮点
    论文使用了超过1000万条CGM测量数据进行训练,并在15个不同的外部数据集中进行了测试,包括多个代谢疾病的人群。GluFormer的嵌入在预测HbA1c、肝功能相关参数、血脂和睡眠相关指标方面表现出色。CGM嵌入还可以在RCT前期预测主要和次要结果。论文还开源了代码和数据集。
  • 相关研究
    最近的相关研究包括使用基于深度学习的方法预测CGM数据和健康结果,以及使用自监督学习训练基础模型的研究。例如,另一篇论文使用基于VAE的方法来生成血糖数据。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论