No more optimization rules: LLM-enabled policy-based multi-modal query optimizer (version 1)

简介

大型语言模型（LLM）标志着机器学习和深度学习领域的一个关键时刻。最近，人们研究了LLM的查询规划能力，包括单模态和多模态查询。然而，目前还没有关于LLM查询优化能力的研究。查询优化是查询计划执行性能的一个关键步骤（甚至可能是最重要的），因此这样的分析和尝试不应该被忽视。另外，现有的查询优化器通常是基于规则或基于规则+成本的，即它们依赖于手动创建的规则来完成查询计划重写/转换。考虑到现代优化器包括数百到数千个规则，设计一个类似的多模态查询优化器是非常耗时的，因为我们必须尽可能多地列举多模态优化规则，这在今天尚未得到很好的解决。在本文中，我们研究了LLM的查询优化能力，并使用LLM设计了LaPuda，一种新颖的基于LLM和策略的多模态查询优化器。LaPuda只需要少量抽象策略来指导LLM进行优化，而不是列举具体详细的规则，从而节省了大量时间和人力。此外，为了防止LLM犯错或进行负优化，我们借鉴了梯度下降的思想，并提出了一种引导成本下降（GCD）算法来执行优化，以使优化保持正确的方向。在我们的评估中，我们的方法在大多数情况下始终优于基线。例如，我们方法生成的优化计划比基线计划的执行速度高1~3倍。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文试图解决查询优化能力在LMM中的问题，提出了一种基于LMM和策略的多模态查询优化器LaPuda，旨在通过少量抽象策略来指导LMM进行优化，从而节省时间和人力成本。
关键思路

LaPuda优化器使用LMM和策略来进行多模态查询优化，相比于现有的基于规则的优化器，LaPuda只需要少量抽象策略来指导LMM进行优化，避免了手动创建规则的时间和人力成本。此外，为了防止LMM出现错误的优化，LaPuda提出了一种基于梯度下降的引导成本下降算法。
其它亮点

实验结果表明，LaPuda优化器在大多数情况下都优于基线方法，优化后的查询计划执行速度比基线方法快1~3倍。此外，该论文还提供了数据集和开源代码。
相关研究

最近的相关研究包括基于规则的查询优化器和基于成本的查询优化器，例如CBO和SQL Server Optimizer等。

No more optimization rules: LLM-enabled policy-based multi-modal query optimizer (version 1)

提问交流

提问交流