【论文标题】SARG: A Novel Semi Autoregressive Generator for Multi-turn Incomplete Utterance Restoration
【作者团队】Mengzuo Huang, Feng Li, Wuhe Zou, Weidong Zhang
【论文链接】https://arxiv.org/abs/2008.01474
【开源链接】https://github.com/NetEase-GameAI/SARG
【接收会议】AAAI 2021
【推荐理由】提出了一种结合序列标注和自回归生成的模型 SARG 来完成多轮对话改写的文本生成任务。定义多轮改写任务为 f(H,U)=R,其中 H 是上下文,U 是当前需要改写的句子,R 是改写后的句子。之前的方法主要是根据 H 和 U 用 seq2seq 方法从头开始生成 R。但是,由于 U 和 R 之间存在天然的重叠性,不同于之前的 seq2seq 方法从头开始解码生成,本算法结合序列标注的优势和自回归生成的优势来完成这个任务。
对于重叠的文本直接用序列标注的方法保留或者删除,对于那些省略需要补充和指代需要替换的文本用自回归方法生成。这样巧妙的设计结合两种模型的优势,并且本算法使用标准的transformer 堆叠的结构来完成序列标注和解码生成,能很方便的加载预训练模型的权重,可以有效地提高改写的质量和生成的速度。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢