论文标题:

Perceiving the World: Question-guided Reinforcement Learning for Text-based Games

论文链接: 

https://aclanthology.org/2022.acl-long.41.pdf

文本游戏提供了一种安全且可交互的学习自然语言处理的方式。虽然深度强化学习已在开发游戏智能体方面展现出了有效性,但低的样本效率和大的动作空间仍然是阻碍其在现实世界中应用的两大挑战。为了解决这两个挑战,本文提出了世界感知模块,通过回答关于世界的问题的方式来进行任务分解和动作剪枝。此外,本文还提出了一个两阶段训练框架,将语言学习(预训练)和决策学习(强化学习)解耦开来,并进一步提升了样本效率。实验结果表明本文方法提高了性能以及样本效率,并且对复合错误和有限的预训练数据具有较好鲁棒性。

内容中包含的图片若涉及版权问题,请及时与我们联系删除