PURPLE: Making a Large Language Model a Better SQL Writer

2024年03月29日
  • 简介
    大型语言模型(LLM)技术在自然语言到SQL(NL2SQL)翻译中发挥着越来越重要的作用。通过广泛的语料库训练的LLMs具有强大的自然语言理解和基本的SQL生成能力,无需针对NL2SQL任务进行额外的调整。现有的基于LLMs的NL2SQL方法尝试通过强调用户意图理解来增强LLMs的翻译能力。然而,由于缺乏组织复杂逻辑运算符组合的知识,LLMs有时会生成不合适的SQL。一种有前途的方法是向LLMs输入演示,其中包括来自各种数据库的已知NL2SQL翻译。LLMs可以从输入的演示中学习如何组织运算符组合以完成给定的任务。在本文中,我们提出了PURPLE(利用预训练模型检索逻辑增强提示),通过检索包含所需逻辑运算符组合的演示来提高准确性,从而引导LLMs产生更好的SQL翻译。PURPLE在流行的NL2SQL基准Spider的验证集上实现了80.5%的精确匹配准确性和87.8%的执行匹配准确性,达到了新的最高水平。PURPLE在各种基准测试、预算限制和各种LLMs中保持高准确性,表现出强大的鲁棒性和成本效益。
  • 图表
  • 解决问题
    论文旨在解决自然语言到SQL翻译中的逻辑运算符组合问题,提高翻译准确率。
  • 关键思路
    论文提出了PURPLE方法,通过输入演示示例来指导LLMs生成更好的SQL翻译,从而提高准确率。
  • 其它亮点
    PURPLE在Spider基准测试中实现了80.5%的准确率和87.8%的执行匹配准确率,表现出鲁棒性和成本效益。论文还使用了多个数据集进行实验,并开源了代码。
  • 相关研究
    在自然语言到SQL翻译领域,最近的相关研究包括Seq2SQL和SQLova等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论