- 简介电子病历(EHRs)包含大量复杂数据,但协调和处理这些信息仍然是一项具有挑战性和昂贵的任务,需要重要的临床专业知识。虽然大型语言模型(LLMs)在各种医疗应用中显示出了潜力,但它们从EHRs中抽象医学概念的潜力仍然很少被探索。我们介绍了EHRmonize,这是一个利用LLMs从EHR数据中抽象医学概念的框架。我们的研究使用来自两个真实世界的EHR数据库的药物数据来评估五个LLMs在两个自由文本提取和六个二进制分类任务上的表现,跨越各种提示策略。在所有任务中,GPT-4o的10-shot提示取得了最高的性能,伴随着在一些任务的子集中的Claude-3.5-Sonnet。GPT-4o在识别通用路线名称方面达到了97%的准确率,在通用药物名称方面为82%,在进行抗生素二进制分类时为100%。虽然EHRmonize显着提高了效率,估计减少了60%的注释时间,但我们强调临床医生的监督仍然是必不可少的。我们的框架作为一个Python包可用,提供了一个有希望的工具,以协助临床医生在EHR数据抽象中,潜在地加速医疗保健研究并改善数据协调过程。
- 图表
- 解决问题本论文旨在利用大型语言模型(LLMs)从电子健康记录(EHR)中抽象医学概念,以提高EHR数据抽象的效率和准确性。
- 关键思路论文提出了一个名为EHRmonize的框架,利用LLMs来自动化EHR数据的抽象过程,并在真实世界的两个EHR数据库中进行了药物数据的实验验证。实验结果表明,GPT-4o在各种提示策略下的表现最佳,其准确率在多个任务中均超过90%。
- 其它亮点论文提出的EHRmonize框架能够显著提高EHR数据抽象的效率,降低注释时间,并为医疗研究和数据协调提供了有力的工具。实验使用的数据集来自真实的EHR数据库,并且作者已经将框架的Python代码开源。
- 最近在这个领域中,也有一些相关研究。例如,一篇名为“Leveraging Pre-trained Language Models for Clinical Information Extraction”的论文也利用了LLMs来提高临床信息提取的效率。
沙发等你来抢
去评论
评论
沙发等你来抢