【标题】Deep Q-Network with Proximal Iteration(具有近似迭代的深Q网络)
【作者团队】Kavosh Asadi, Rasool Fakoor, Omer Gottesman, Michael L. Littman, Alexander J. Smola。
【发表日期】10 December, 2021
【论文链接】https://arxiv.org/pdf/2112.05848.pdf
【推荐理由】在强化学习中,采用近似迭代法优化值函数。近似迭代是一种计算效率高的技术,它使我们能够将优化过程偏向于更理想的解决方案。作为近端迭代在深度强化学习中的具体应用,我们赋予深度Q网络(DQN)代理的目标函数一个近端项,以确保DQN的在线网络组件保持在目标网络附近。最终的代理,称之为DQN与近端迭代,或DQNPro,在Atari基准上比原始的DQN有显著的改进。结果强调了采用声音优化技术进行深度强化学习的能力。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢