链接: https://arxiv.org/pdf/1911.05889.pdf

1.Motivation

虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功,但是这些数据驱动的对话系统仍然无法很自然的与人类对话,其中的一个主要问题就是对话系统缺乏一致的角色特征。图1中的例子展示了角色一致性是如何影响对话的质量。提高对话系统角色一致性的一个实用方法是明确定义一组描述对话系统角色信息(persona)的描述性文本,并以此为基础学习生成体现出预先定义角色信息的回复。尽管编码器-解码器框架在基于角色信息的对话生成模型中得到了成功的应用,但存在的问题是这些生成模型普遍缺乏对于一致性信息的建模。一方面,近几年自然语言推理技术(Natural Language Inference)相关技术有了长足的进步。有研究工作表明,回复和角色文本的一致性检测问题可以被建模为<角色信息,回复>之间的自然语言推理技术问题。如何在基于角色信息的对话生成模型中利用这种检测方法建模并提高角色的一致性是一个值得探索的问题。

Contribution

论文亮点主要包括: (1)提出了一个用于角色一致对话生成的RL框架,解决了在基于角色的对话模型中区分训练目标的挑战。 (2)这是第一项用NLI技术来增强角色一致性对话生成的工作。 (3)实验结果表明,提出的模型优于强基准,尤其是在角色一致性方面。

Conclusion

在该项工作中,论文探索了利用自然语言推理技术来建模开放域对话生成中人物角色一致性的问题。为此,论文将该任务转化为一个强化学习问题,并在生成模型中利用自然语言推理技术信号提高回复的一致性。通过在PersonaChat数据集上的实验,论文证明了论文的方法相比于基线模型获得了有效提升。

内容中包含的图片若涉及版权问题,请及时与我们联系删除