A Novel Technique for Query Plan Representation Based on Graph Neural Nets

2024年05月08日
  • 简介
    学习查询计划的表示对于基于机器学习的数据库管理系统查询优化器至关重要。为此,文献中提出了特定的模型架构,将树形结构的查询计划转化为下游机器学习模型可学习的表示格式。然而,现有研究很少比较和分析这些树状模型的查询计划表示能力及其对整个优化器性能的直接影响。为解决这个问题,我们进行了比较研究,探索使用不同最先进的树状模型对相对复杂的工作负载中优化器的成本估计和计划选择性能的影响。此外,我们还探讨了在查询计划表示任务中使用图神经网络(GNNs)的可能性。我们提出了一种新颖的树状模型BiGG,采用双向GNN聚合门控循环单元(GRUs),并通过实验证明BiGG在成本估计任务中提供了显着的改进,并且相对于最先进的树状模型,具有相对优秀的计划选择性能。
  • 图表
  • 解决问题
    本论文旨在解决机器学习优化器中查询计划表示的问题,并比较不同树模型和图神经网络模型在成本估算和计划选择性能方面的影响。
  • 关键思路
    论文提出了一种新的树模型BiGG,采用双向图神经网络和门控循环单元进行聚合,相较于现有的树模型在成本估算和计划选择性能上有显著的提升。
  • 其它亮点
    实验设计了比较复杂的工作负载,使用了多个数据集并开源了代码。本论文提出的BiGG模型在成本估算和计划选择性能上表现优异,值得进一步研究。
  • 相关研究
    相关的研究包括:1. Learning to Optimize Join Queries With Deep Reinforcement Learning; 2. Learning Query Embeddings for Query Performance Prediction; 3. A Comparison of Join Algorithms for Log Processing in MapReduce.
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论