提出一种新的深度强化学习算法,采用双曲几何来建模潜表示,有效提高了性能和泛化能力。

Hyperbolic Deep Reinforcement Learning

E Cetin, B P Chamberlain, M M Bronstein, J J Hunt
[King's College London & University of Oxford & Twitter]

  1. 介绍了如何将双曲几何引入到深度强化学习中,以捕捉状态之间的分层关系;
  2. 提出新的稳定性策略,即正则化双曲映射,以解决深度强化学习中的优化挑战;
  3. 将双曲版本的常用强化学习算法应用于 Procgen 和 Atari 100K 基准测试,取得了几乎普遍的性能和泛化效果提升;
  4. 实验结果表明,双曲表示提供了更适合控制的深度模型先验,具有显著的泛化和样本效率优势。

https://openreview.net/forum?id=TfBHFLgv77 
图片
图片
图片
图片