【标题】A Generative User Simulator with GPT-based Architecture and Goal State Tracking for Reinforced Multi-Domain Dialog Systems
【作者团队】Hong Liu, Yucheng Cai, Zhijian Ou, Yi Huang, Junlan Feng
【发表日期】2022.10.18
【论文链接】https://arxiv.org/pdf/2210.08692.pdf
【推荐理由】为面向任务的对话系统(DS)的强化学习(RL)构建用户模拟器(US)已经受到越来越多的关注,然而,这仍然面临一些基本挑战。首先,目前尚不清楚我们是否可以利用预训练的语言模型来设计,例如,基于GPT-2的用户界面,以赶上最近先进的基于GPT-1的用户界面并与之交互。第二,美国的一个重要因素是用户目标可以被有效地纳入和跟踪;但如何灵活地集成目标状态跟踪,并为多域开发端到端可训练的US,仍然是一个挑战。本文提出了基于GPT-2架构和目标状态跟踪的生成式用户模拟器(GUS),以解决上述两个挑战。在MultiWOZ2.1上进行了广泛的实验。通过RL和GUS、经典的基于议程的用户模拟器(ABUS)和其他消融模拟器分别训练不同的DS,并对其进行跨模型评估、基于语料库的评估和人类评估。GUS在所有三项评估任务中都取得了优异的结果。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢