SQL 生成 (text-to-SQL) 是自动化软件工程的重要应用之一, 也是语义解析领域的研究热点. SQL 生成根据输入的自然语言描述自动生成相应的 SQL 数据库查询语句, 它允许非专业人员在不了 解 SQL 语法的情况下访问数据库. 随着大量 SQL 相关数据集的不断构造以及人工智能技术的卓越进 步, SQL 生成任务也得到了极大的发展. 基于深度学习的 SQL 生成 (deep learning-based text-to-SQL) 能够利用大规模数据的优势, 从已有数据中学习自然语言、数据库以及 SQL 语句的表示, 并根据新的 自然语言输入生成符合查询需求的 SQL 语句. 相对于传统的 SQL 生成, 基于深度学习的 SQL 生成 具有高准确率、输入信息灵活和可迭代学习的优点. 近年来, 研究者在基于深度学习的 SQL 生成方面 进行了一系列的研究, 本文从 SQL 生成场景、数据集、模型结构和评估方法层面对现有研究进行分类综述。

论文链接:https://www.sciengine.com/SSI/doi/10.1360/SSI-2021-0316

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除