- 简介最近大型语言模型(LLMs)的进展显著促进了文本到SQL任务的进展。这些工作的一个共同要求是对SQL查询进行后校正。然而,这个过程的大部分内容涉及分析错误案例以开发具有规则的提示,以消除模型偏差。并且缺乏SQL查询的执行验证。此外,主要技术主要依赖于GPT-4和少量提示,导致成本昂贵。为了研究一种成本效益高的SQL细化有效方法,我们引入了具有自适应细化的语义增强文本到SQL(SEA-SQL),其中包括自适应偏差消除和动态执行调整,旨在提高性能,同时最小化资源支出,使用零提示。具体而言,SEA-SQL采用语义增强模式来增强数据库信息并优化SQL查询。在SQL查询生成期间,应用了精细调整的自适应偏差消除器来减轻LLM引起的固有偏差。动态执行调整被用于确保消除偏差的SQL查询的可执行性。我们在Spider和BIRD数据集上进行实验,以展示该框架的有效性。结果表明,SEA-SQL在GPT3.5场景下实现了最先进的性能,成本为生成成本的9%-58%。此外,SEA-SQL与GPT-4相比,只有0.9%-5.3%的生成成本,性能相当。
-
- 图表
- 解决问题SEA-SQL旨在解决Text-to-SQL任务中SQL查询的纠错和执行验证问题,同时减少使用昂贵的GPT-4和few-shot prompts的成本。
- 关键思路SEA-SQL包括语义增强模式和自适应纠正,使用自适应偏差消除和动态执行调整来优化SQL查询,提高性能并降低成本。
- 其它亮点论文使用Spider和BIRD数据集进行实验,证明SEA-SQL在GPT3.5情景下达到了最先进的性能,只需9%-58%的生成成本。此外,SEA-SQL与GPT-4相比,只需0.9%-5.3%的生成成本。
- 相关研究包括使用LLM的Text-to-SQL任务,以及使用规则和模板进行SQL查询纠正的方法。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流