谷歌大脑和DeepMind联合发布离线强化学习基准RL Unplugged

最近，Google Brain和DeepMind联合提出了一个称为RL Unplugged的基准工具，以评估和比较离线RL方法。RL Unplugged包含来自多个领域的数据，包括游戏（例如Atari基准测试）和模拟的电机控制等（例如DM Control Suite）。RL Unplugged为每个任务域提出了详细的评估方法，对监督学习和离线RL方法进行了广泛的分析，数据集包括部分或完全可观察的任务域，使用连续或离散的动作，并且具有随机性和非平稳性等，能很好地评估强化学习智能体的性能。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

谷歌大脑和DeepMind联合发布离线强化学习基准RL Unplugged

评论