- 简介将自然语言问题转化为SQL查询对于从电子病历(EHR)数据库中精确检索数据至关重要。这个过程中的一个重要挑战是检测和拒绝那些请求超出数据库范围或超过系统能力的无法回答的问题。本文介绍了一种新的文本到SQL框架,可以强大地处理域外问题,并通过查询执行验证生成的查询。我们的框架首先将问题的结构标准化为模板格式。我们使用了一个强大的大型语言模型(LLM),即细节提示涉及EHR数据库系统的表模式的fine-tuned GPT-3.5。我们的实验结果表明了我们的框架在ClinicalNLP研讨会的EHRSQL-2024基准测试中的有效性。虽然直接对GPT进行微调在开发集上显示出了有希望的结果,但它在测试集中的域外问题上表现不佳。通过我们的框架,我们提高了系统的适应性,并在EHRSQL-2024挑战赛的官方排行榜上取得了竞争性的表现。
- 图表
- 解决问题本论文试图解决从电子健康记录(EHR)数据库中精确检索数据的问题,包括检测和拒绝超出数据库范围或超出系统能力的无法回答的问题。
- 关键思路本论文提出了一种新颖的文本到SQL框架,使用大型语言模型(LLM)fine-tuned GPT-3.5,并将其与EHR数据库系统的表模式相关的详细提示相结合,以标准化问题结构并生成可靠的SQL查询。
- 其它亮点本论文的实验结果表明,该框架在EHRSQL-2024基准测试中表现出色,并提高了系统的适应性。实验使用的数据集是EHRSQL-2024基准测试,论文还开源了代码。
- 在最近的相关研究中,还有一些与本论文相关的研究,例如:《Neural Data-to-Text Generation: A Comparative Review》、《A Survey on Natural Language Processing for Electronic Health Records》等。
沙发等你来抢
去评论
评论
沙发等你来抢