题目:Learning Spoken Language Representations with Neural Lattice Language Modeling 本文发表于ACL2020,研究如何生成口语化语言表示。当下的预训练模型大多专注于使用书面文本语料,没有考虑到我们日常生活中更加口语化的自然语言。词格(Lattice)是语音识别中用来保存识别候选序列的概念。作者借鉴预训练模型的思想,力图用识别系统进行词格生成。具体方法是提出神经词格网络模型预训练的概念,并设计了“识别”与“理解”两阶段训练框架,用于口语语言表达下游任务当中。在意图检测和对话行为识别数据集上取得了超过基线模型的效果。 论文:https://www.aclweb.org/anthology/2020.acl-main.347.pdf 代码:https://github.com/MiuLab/Lattice-ELMo
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢