PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency

2024年03月13日
  • 简介
    最近的文本到SQL(Text2SQL)技术的进展强调在上下文学习中刺激大型语言模型(LLM),取得了显著的结果。然而,当处理冗长的数据库信息和复杂的用户意图时,这些技术面临挑战。本文提出了一个两阶段框架,以提高当前基于LLM的自然语言到SQL系统的性能。我们首先介绍了一种新的提示表示方法,称为参考增强表示法,其中包括模式信息和从表格中随机抽样的单元格值,以指导LLM生成SQL查询。然后,在第一阶段,问题-SQL对作为少样本演示被检索出来,提示LLM生成初步SQL(PreSQL)。之后,对PreSQL中提到的实体进行解析以进行模式链接,这可以显著压缩有用信息。在第二阶段中,使用链接的模式,我们简化了提示的模式信息,并指导LLM生成最终的SQL。最后,作为后处理模块,我们提出使用不同LLM之间的交叉一致性而不是特定LLM内的自我一致性。我们的方法在Spider基准测试中实现了新的SOTA结果,执行精度为87.6%。
  • 图表
  • 解决问题
    这篇论文旨在提高当前基于大型语言模型(LLM)的自然语言到SQL系统的性能,解决处理冗长数据库信息和复杂用户意图的挑战。
  • 关键思路
    该论文提出了一个两阶段框架来增强当前基于LLM的自然语言到SQL系统的性能。第一阶段使用新的提示表示法,称为参考增强表示法,包括模式信息和从表中随机抽样的单元格值,以指导LLM生成SQL查询。第二阶段使用链接的模式简化提示的模式信息,并指导LLM生成最终的SQL。
  • 其它亮点
    该论文的方法在Spider基准测试中取得了新的最优结果,执行准确率达到87.6%。实验设计了两个阶段的框架和后处理模块,并使用了跨不同LLM的交叉一致性来进行后处理。
  • 相关研究
    在最近的相关研究中,也有一些关于自然语言到SQL的研究,如《Editing-Based SQL Query Generation for Cross-Domain Context-Dependent Questions》和《Improving Text-to-SQL Evaluation Methodology》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论