Deep Q-Network with Proximal Iteration（具有近似迭代的深Q网络）

【标题】Deep Q-Network with Proximal Iteration（具有近似迭代的深Q网络）

【作者团队】Kavosh Asadi, Rasool Fakoor, Omer Gottesman, Michael L. Littman, Alexander J. Smola。

【发表日期】10 December, 2021

【论文链接】https://arxiv.org/pdf/2112.05848.pdf

【推荐理由】在强化学习中，采用近似迭代法优化值函数。近似迭代是一种计算效率高的技术，它使我们能够将优化过程偏向于更理想的解决方案。作为近端迭代在深度强化学习中的具体应用，我们赋予深度Q网络（DQN）代理的目标函数一个近端项，以确保DQN的在线网络组件保持在目标网络附近。最终的代理，称之为DQN与近端迭代，或DQNPro，在Atari基准上比原始的DQN有显著的改进。结果强调了采用声音优化技术进行深度强化学习的能力。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Deep Q-Network with Proximal Iteration（具有近似迭代的深Q网络）

评论