- 简介医学的核心在于医患对话,娴熟的病史采集为准确诊断、有效治疗和持久信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高医疗保健的可及性、一致性和质量。然而,接近临床医生的专业水平仍然是一个重大挑战。在这里,我们介绍了AMIE(Articulate Medical Intelligence Explorer),这是一个基于大型语言模型(LLM)的AI系统,专门优化了诊断对话。AMIE使用一种新颖的自我对话模拟环境,配备自动化反馈机制,以实现跨不同疾病情况、专业领域和背景的学习扩展。我们设计了一个评估临床相关性绩效轴的框架,包括病史采集、诊断准确性、治疗推理、沟通技巧和同理心。我们通过一项随机、双盲、交叉研究,使用经过验证的患者演员模拟病例的文本咨询方式,与加拿大、英国和印度的临床医疗提供者的149个病例场景进行比较,共有20名初级保健医生参与与AMIE的比较,并由专科医生和患者演员进行评估。AMIE在28个32个绩效轴上表现出更高的诊断准确性和卓越的表现,根据专科医生的评估,在26个26个绩效轴上表现出更高的表现,这些结果代表了向会话式诊断AI迈进的一个里程碑。我们的研究有几个局限性,应该适当谨慎地解释。临床医生仅限于不熟悉的同步文本聊天,这允许大规模的LLM-患者交互,但并不代表通常的临床实践。虽然在将AMIE转化为实际世界的设置之前需要进一步的研究,但这些结果代表了会话式诊断AI的一个里程碑。
- 图表
- 解决问题论文旨在解决医学领域中医患对话的问题,尝试使用人工智能系统进行诊断对话,提高医疗服务的可访问性、一致性和质量。
- 关键思路本文介绍了一个基于大型语言模型(LLM)的人工智能系统AMIE,通过自我对话的模拟环境和自动化反馈机制,实现了跨不同疾病情况、专业领域和背景的学习,优化了诊断对话的性能。
- 其它亮点论文设计了一个评估框架,包括历史采集、诊断准确性、管理推理、沟通技巧和同理心等临床相关的性能指标。通过与20名初级医生在149个病例场景上进行双盲交叉对照研究,AMIE在28个性能指标上优于专家医生和24个性能指标上优于患者演员。实验结果表明,AMIE具有更高的诊断准确性和更好的性能表现。
- 近年来,医疗领域中的人工智能研究不断涌现。例如,使用深度学习进行医学图像诊断,使用自然语言处理技术进行疾病预测和患者诊断等。
沙发等你来抢
去评论
评论
沙发等你来抢