Synthetic Query Generation using Large Language Models for Virtual Assistants

简介

虚拟助手是重要的信息检索平台，可以通过口头命令帮助用户完成各种任务。语音识别系统（语音转文本）使用仅基于文本的查询先验知识来区分发音相似的替代词。因此，生成类似于现有虚拟助手使用的合成查询可以极大地提高虚拟助手的能力，特别是对于尚未出现在配对音频/文本数据中的用例。在本文中，我们初步探讨了使用大型语言模型（LLMs）生成与基于模板方法互补的合成查询的可能性。我们研究了这些方法是否（a）生成与从热门虚拟助手中随机抽样、代表性和匿名化的用户查询相似的查询，以及（b）生成的查询是否具有特定性。我们发现，与基于模板的方法相比，LLMs生成的查询更加冗长，并引用与实体相关的方面。生成的查询类似于虚拟助手用户查询，并且具有足够的特定性以检索相关实体。我们得出结论，LLMs和模板生成的查询是互补的。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在探索使用大型语言模型（LLMs）生成与虚拟助手（VA）使用相似的合成查询，以提高VA的能力。
关键思路

本论文提出了一种使用LLMs生成合成查询的方法，与基于模板的方法相辅相成。
其它亮点

本论文发现，与基于模板的方法相比，LLMs生成的查询更加详细，并涉及实体的特定方面。生成的查询类似于VA用户查询，并且足够具体以检索相关实体。
相关研究

最近的相关研究包括使用神经网络生成查询和使用自然语言生成模型生成语音助手的响应。

Synthetic Query Generation using Large Language Models for Virtual Assistants

提问交流

提问交流