论文名称:A Survey on Spoken Language Understanding: Recent Advances and New Frontiers 论文作者:覃立波,谢天宝,车万翔,刘挺 论文链接:https://arxiv.org/abs/2103.03095 仓库链接:https://github.com/yizhen20133868/Awesome-SLU-Survey

口语语言理解(Spoken Language Understanding,SLU)作为任务型对话系统的核心组件,目的是为了获取用户询问语句的框架语义表示(semantics frame)信息,进而将这些信息为对话状态追踪模块(DST)以及自然语言生成模块(NLG)所使用。SLU任务通常包含以下两个任务:意图识别任务(intent detection)和槽位填充任务(slot filling),以下图的句子I like to watch action movie为例,这两个任务的输出对应分别为WatchMovie和O, O, O, B-movie-type,I-movie-type, I-movie-type。

意图标注和槽位标注(BIO格式)
一般来讲,我们可以将意图识别视作为一个句分类问题,研究也主要基于怎么样对句子粒度的特征进行更好的表示。从传统特征表示到CNN到基于RNN的一系列模型等等,更好的句子表示被不断地挖掘。意图识别问题可以被视作是一个序列分类问题,流行的方法从CRF到RNN再到LSTM等,研究为了对对话单句里面的词进行更好的表示而不断挖掘。传统的方法一般将意图识别和槽位填充视作两个独立的任务,忽视了这两个任务之间的共享的信息。比如如果一个句子的意图是WatchMovie,那么这个句子就更可能包含movie name的槽位而不是music name的槽位。考虑到这一点,随着对于联合模型的进一步挖掘,目前最好的工作,已经在SLU领域的两个最被广泛使用的数据集ATIS和SNIPS上取得了96.6%和97.1%的槽位填充表现和98%到99%的意图识别表现。

如此高的分数不禁留给了我们研究者一个问题:我们已经完美地解决了口语语言理解这个任务了吗? 我们将通过领域综述的方式解答这个问题,我们的综述内容主要包含三个方面:

  • 最近SLU领域进展的全面总结;
  • 复杂情景下研究的挑战和机遇;
  • SLU全面的代码,数据集等资源。

由于文章版面有限,为了更好地协助社区工作,我们在开源社区Github公开了我们的全面的整理,包含有领域最新的开源论文文章和代码的整理,SLU各个数据集的介绍、获取方式等信息整理,主流数据集上的LeaderBoard榜单整理等等。链接:https://github.com/yizhen20133868/Awesome-SLU-Survey

我们希望我们的努力可以帮助到社区的研究人员和有志于该领域研究的研究者,同时希望大家多多fork&pr,共同将这个社区维护起来搭建下去。

感兴趣的可以戳原文。

内容中包含的图片若涉及版权问题,请及时与我们联系删除