LLM-R2: A Large Language Model Enhanced Rule-based Rewrite System for Boosting Query Efficiency

2024年04月19日
  • 简介
    查询重写(Query Rewrite)旨在通过改变SQL查询的结构而不改变查询结果,从而生成更高效的查询,一直是一个重要的研究问题。为了在重写过程中保持重写后的查询和原始查询的等效性,传统的查询重写方法总是遵循某些重写规则来重写查询。然而,仍然存在一些问题。首先,现有的寻找最佳重写规则选择或序列的方法仍然有限,而且这个过程总是耗费大量资源。涉及发现新的重写规则的方法通常需要复杂的结构逻辑证明或广泛的用户交互。其次,当前的查询重写方法通常高度依赖于DBMS成本估算器,而这些估算器往往不准确。本文提出了一种名为LLM-R2的查询重写新方法,采用大型语言模型(LLM)为数据库重写系统提供可能的重写规则,以解决这些问题。为了进一步提高LLM在推荐重写规则方面的推理能力,我们通过课程学习训练对比模型来学习查询表示并选择LLM的有效查询演示。实验结果表明,我们的方法可以显著提高查询执行效率,并胜过基线方法。此外,我们的方法在不同数据集上具有高鲁棒性。
  • 图表
  • 解决问题
    本论文旨在解决查询重写的问题,通过提出一种新的方法LLM-R2,采用大型语言模型(LLM)来为数据库重写系统提出可能的重写规则,并通过训练对比模型来进一步提高LLM在推荐重写规则方面的推理能力。
  • 关键思路
    本论文的关键思路是采用大型语言模型(LLM)来为数据库重写系统提出可能的重写规则,并通过训练对比模型来进一步提高LLM在推荐重写规则方面的推理能力。
  • 其它亮点
    本论文的亮点包括:1. 提出了一种新的查询重写方法LLM-R2,采用大型语言模型来为数据库重写系统提出可能的重写规则;2. 通过训练对比模型来进一步提高LLM在推荐重写规则方面的推理能力;3. 实验结果表明,LLM-R2方法可以显著提高查询执行效率,并优于基线方法;4. LLM-R2方法在不同数据集上表现出高鲁棒性。
  • 相关研究
    在这个领域中,最近的相关研究包括:1. "Query Optimization by Deep Reinforcement Learning";2. "Neural Query Rewriting for Knowledge Base Question Answering"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论