- 简介大型语言模型(LLM)技术在自然语言到SQL(NL2SQL)翻译中发挥着越来越重要的作用。通过广泛的语料库训练的LLMs具有强大的自然语言理解和基本的SQL生成能力,无需针对NL2SQL任务进行额外的调整。现有的基于LLMs的NL2SQL方法尝试通过强调用户意图理解来增强LLMs的翻译能力。然而,由于缺乏组织复杂逻辑运算符组合的知识,LLMs有时会生成不合适的SQL。一种有前途的方法是向LLMs输入演示,其中包括来自各种数据库的已知NL2SQL翻译。LLMs可以从输入的演示中学习如何组织运算符组合以完成给定的任务。在本文中,我们提出了PURPLE(利用预训练模型检索逻辑增强提示),通过检索包含所需逻辑运算符组合的演示来提高准确性,从而引导LLMs产生更好的SQL翻译。PURPLE在流行的NL2SQL基准Spider的验证集上实现了80.5%的精确匹配准确性和87.8%的执行匹配准确性,达到了新的最高水平。PURPLE在各种基准测试、预算限制和各种LLMs中保持高准确性,表现出强大的鲁棒性和成本效益。
- 图表
- 解决问题论文旨在解决自然语言到SQL翻译中的逻辑运算符组合问题,提高翻译准确率。
- 关键思路论文提出了PURPLE方法,通过输入演示示例来指导LLMs生成更好的SQL翻译,从而提高准确率。
- 其它亮点PURPLE在Spider基准测试中实现了80.5%的准确率和87.8%的执行匹配准确率,表现出鲁棒性和成本效益。论文还使用了多个数据集进行实验,并开源了代码。
- 在自然语言到SQL翻译领域,最近的相关研究包括Seq2SQL和SQLova等。
沙发等你来抢
去评论
评论
沙发等你来抢