- 简介社会卫生决定因素(SDoH)在塑造健康结果方面发挥着至关重要的作用,特别是在儿科人群中,干预措施可能具有长期影响。SDoH经常在电子病历(EHR)中进行研究,EHR提供了丰富的患者数据存储库。在这项工作中,我们提出了一个新的注释语料库,即儿科社会史注释语料库(PedSHAC),并使用经过微调和上下文学习方法的大型语言模型(LLM)评估了详细SDoH表示的自动提取。PedSHAC包括从华盛顿大学(UW)医院系统的儿科患者中获取的1,260份临床记录的社会史部分进行注释。采用基于事件的注释方案,PedSHAC捕获十个不同的健康决定因素,包括生活和经济稳定性、先前的创伤、教育机会、物质使用史和心理健康,整体注释者一致性为81.9 F1。我们提出的基于微调的LLM提取器在事件参数方面取得了高性能,F1为78.4。使用GPT-4的上下文学习方法展示了可靠的SDoH提取前景,仅有有限的注释示例,事件触发器的提取性能为82.3 F1。
- 图表
- 解决问题本论文旨在解决社会健康决定因素(SDoH)在儿科人群中的自动提取问题,提供了一个新的标注语料库,并探索了基于大型语言模型的自动提取方法。
- 关键思路该论文的关键思路是使用基于大型语言模型的自动提取方法来提取儿科患者社会史中的SDoH信息,包括居住和经济稳定性、既往创伤、教育接触、物质使用史和心理健康等方面。
- 其它亮点该论文提供了一个新的标注语料库PedSHAC,用于儿科患者社会史中SDoH信息的自动提取。研究采用了基于大型语言模型的自动提取方法,包括Fine-tuning和In-context learning方法,并取得了较好的效果。实验表明,在有限的标注数据下,In-context learning方法能够提高自动提取的准确性。该论文的工作有助于改善儿科患者的健康状况。
- 在相关研究中,也有学者使用自然语言处理技术来提取患者的社会历史信息,例如:"Extracting social determinants of health from electronic health records: A natural language processing approach"和"A natural language processing system that links medical terms in electronic health record notes to lay definitions: A development and validation study"。
沙发等你来抢
去评论
评论
沙发等你来抢