PURPLE: Making a Large Language Model a Better SQL Writer

简介

大型语言模型（LLM）技术在自然语言到SQL（NL2SQL）翻译中发挥着越来越重要的作用。通过广泛的语料库训练的LLMs具有强大的自然语言理解和基本的SQL生成能力，无需针对NL2SQL任务进行额外的调整。现有的基于LLMs的NL2SQL方法尝试通过强调用户意图理解来增强LLMs的翻译能力。然而，由于缺乏组织复杂逻辑运算符组合的知识，LLMs有时会生成不合适的SQL。一种有前途的方法是向LLMs输入演示，其中包括来自各种数据库的已知NL2SQL翻译。LLMs可以从输入的演示中学习如何组织运算符组合以完成给定的任务。在本文中，我们提出了PURPLE（利用预训练模型检索逻辑增强提示），通过检索包含所需逻辑运算符组合的演示来提高准确性，从而引导LLMs产生更好的SQL翻译。PURPLE在流行的NL2SQL基准Spider的验证集上实现了80.5％的精确匹配准确性和87.8％的执行匹配准确性，达到了新的最高水平。PURPLE在各种基准测试、预算限制和各种LLMs中保持高准确性，表现出强大的鲁棒性和成本效益。

作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~

图表

解决问题

论文旨在解决自然语言到SQL翻译中的逻辑运算符组合问题，提高翻译准确率。

关键思路

论文提出了PURPLE方法，通过输入演示示例来指导LLMs生成更好的SQL翻译，从而提高准确率。

其它亮点

PURPLE在Spider基准测试中实现了80.5％的准确率和87.8％的执行匹配准确率，表现出鲁棒性和成本效益。论文还使用了多个数据集进行实验，并开源了代码。

PURPLE: Making a Large Language Model a Better SQL Writer

提问交流

提问交流