【论文标题】Structured Hierarchical Dialogue Policy with Graph Neural Networks 【作者团队】Zhi Chen, Xiaoyuan Liu, Lu Chen, Kai Yu 【发表时间】2020/9/22 【论文链接】https://arxiv.org/abs/2009.10355
【推荐理由】
本文来自上海交通大学团队,该论文利用图神经网络,提出了一种新颖的ComNet,以对分层代理的结构进行建模,解决了传统的HDRL方法经常遭受采样效率低和可传递性差的问题。
复合任务的对话策略训练是一个非常重要且具有挑战性的问题。最近,分层深度强化学习(HDRL)方法在复合任务中取得了良好的性能。但是,在原始HDRL中,高层策略和低层策略都由多层感知器表示,这些感知器将来自环境的所有观察结果串联起来作为预测行动的输入。因此,传统的HDRL方法经常遭受采样效率低和可传递性差的困扰。
在本文中,本文通过利用图神经网络的灵活性解决了这些问题。作者提出了一种新颖的ComNet,以对分层代理的结构进行建模。作者针对ComNet的性能在PyDialbenchmark的复合任务上进行了测试。实验表明,ComNet的性能可胜过普通的HDRL系统。它不仅可以实现高采样效率,而且在保持传递到其他复合任务的传输能力的同时,更不容易被噪音干扰。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢