提出一种新的深度强化学习算法,采用双曲几何来建模潜表示,有效提高了性能和泛化能力。
Hyperbolic Deep Reinforcement Learning
E Cetin, B P Chamberlain, M M Bronstein, J J Hunt
[King's College London & University of Oxford & Twitter]
-
介绍了如何将双曲几何引入到深度强化学习中,以捕捉状态之间的分层关系; -
提出新的稳定性策略,即正则化双曲映射,以解决深度强化学习中的优化挑战; -
将双曲版本的常用强化学习算法应用于 Procgen 和 Atari 100K 基准测试,取得了几乎普遍的性能和泛化效果提升; -
实验结果表明,双曲表示提供了更适合控制的深度模型先验,具有显著的泛化和样本效率优势。
https://openreview.net/forum?id=TfBHFLgv77
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢