双曲深度强化学习

白羽中 2023-03-19 08:56 分享

以下文章来源于openreview.net

提出一种新的深度强化学习算法，采用双曲几何来建模潜表示，有效提高了性能和泛化能力。

Hyperbolic Deep Reinforcement Learning

E Cetin, B P Chamberlain, M M Bronstein, J J Hunt
[King's College London & University of Oxford & Twitter]

介绍了如何将双曲几何引入到深度强化学习中，以捕捉状态之间的分层关系；
提出新的稳定性策略，即正则化双曲映射，以解决深度强化学习中的优化挑战；
将双曲版本的常用强化学习算法应用于 Procgen 和 Atari 100K 基准测试，取得了几乎普遍的性能和泛化效果提升；
实验结果表明，双曲表示提供了更适合控制的深度模型先验，具有显著的泛化和样本效率优势。

https://openreview.net/forum?id=TfBHFLgv77

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

沙发等你来抢

去评论