【论文标题】用于个性化对话框生成的多任务学习和强化学习:一项实证研究Multitask Learning and Reinforcement Learning for Personalized Dialog Generation: An Empirical Study
【作者团队】Min Yang,Weiyi Huang,Wenting Tu,Qiang Qu,Ying Shen,Kai Lei
【发表时间】2020-01-04
【论文链接】https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9025776
【推荐理由】开放域对话框的生成是人工智能的重要组成部分,是必不可少且具有挑战性的问题。该论文提出了一种个性化对话系统,该系统利用了多任务学习和强化学习的优势来进行个性化对话生成(MRPDG)。具体来说,MRPDG包含两个子任务:1)作者配置文件模块,可从输入句子中识别用户特征(辅助任务); 2)个性化对话框生成系统,可使用强化学习算法生成信息性,语法性和连贯性的响应(主要任务) )。提出了三种奖励来产生高质量的对话。文章调查了三种广泛使用的强化学习方法的有效性[即Q学习,策略梯度,和(AC)算法],并证明AC算法在底层框架上达到了最佳效果。实验结果表明,MRPDG能够为具有不同特征的用户生成高质量的个性化对话框。从数量上看,所提出的模型在不同的评估指标(如人工评估,双语评估研究(BLEU)和困惑)上的性能要优于比较方法。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢