- 简介将自然语言查询转换为SQL查询的任务是复杂的,需要精确的技术来进行准确的翻译。DIN-SQL(Decomposed-In-Context SQL)方法是该领域的一个重要发展。本文介绍了DFIN(Decomposed Focused-In-Context),它是DIN-SQL的一种创新扩展,通过解决模式链接错误来增强文本到SQL转换,这是不准确的主要原因之一。DFIN独特地在提示技术和检索增强生成(RAG)之间交替,适应数据库模式的大小和复杂性。预处理阶段嵌入数据库定义,并利用类似于BIRD数据集中的注释文件,便于运行时检索相关的模式信息。这种策略显著减少了模式链接提示的令牌计数,使得可以使用标准的GPT-4模型而不是更大的上下文变量,从而更有效地处理大规模数据库,也更经济。我们在BIRD数据集上进行的评估表明,DFIN不仅可以高效扩展,而且可以提高准确性,达到了51.69的分数。这一改进超过了DIN-SQL方法(当前排名第三),该方法是使用上下文学习而不是微调的最高排名模型,先前得分为50.72。DFIN的进步凸显了上下文学习方法与先进语言模型的不断发展的能力,为复杂的文本到SQL转换任务提供了一个有前途的研究途径。
- 图表
- 解决问题本文旨在通过解决模式链接错误的问题,提高文本到SQL转换的准确性。同时,本文还试图解决大规模数据库的转换问题。
- 关键思路本文提出了DFIN(Decomposed Focused-In-Context)方法,通过交替使用提示技术和Retrieval-Augmented Generation(RAG)方法,以及预处理阶段中的数据库定义和注释文件,来提高模式链接的准确性和效率。DFIN方法不仅适用于小型数据库,还适用于大规模数据库,并且在BIRD数据集上取得了比DIN-SQL更高的得分。
- 其它亮点本文的亮点在于提出了DFIN方法,该方法通过预处理和交替使用提示技术和RAG方法,显著提高了文本到SQL转换的准确性和效率。实验使用了BIRD数据集,取得了比DIN-SQL更高的得分。此外,本文还提供了开源代码。
- 最近的相关研究包括DIN-SQL、Seq2SQL和SQLNet等。
沙发等你来抢
去评论
评论
沙发等你来抢