【标题】Survey on Memory-augmented Deep Reinforcement Learning 【研究机构】电子科大 摘要: 近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点。 本文根据记忆增强型神经网络类型,将记忆增强型深度强化学习分为了 4 类: 1. 基于经验回放的深度强化学习、 2. 基于记忆网络的深度强化学习算法、 3. 基于情景记忆的深度强化学习算法、 4. 基于可微分计算机的深度强化学习. 简介: 深度强化学习在环境认知和控制策略中表现突出,能实现智能体(如真实机器人、虚拟机器人或游戏中的人物等)从被动感知环境到主动认知环境,且具有较好的通用性. 但在动态复杂的现实环境中,智能体的行为具有高维的状态空间,此时深度强化学习算法存在复杂度较高,求解效率低的问题。故在深度强化学习模型中引入记忆,一方面能充分利用先验知识,使智能体能直接利用过往事件中收集到的信息来指导行为,减少试错次数,加快训练的收敛速度;同时,记忆使得深度强化学习智能体具有某种程度的主动认知和推理能力,使其快速遍历环境状态,帮助智能体更好地完成目标任务。 论文结构: 本文系统性地从如下5个方面进行论述:1. 强化学习的基本理论、2. 常用的深度强化学习算法、3. 记忆增强型深度强化学习络进行分类及其研究进展、4. 常用的训练环境、5. 记忆增强型深度强化学习存在的不足与未来研究方向。

内容中包含的图片若涉及版权问题,请及时与我们联系删除