【标题】Benchmarking Offline Reinforcement Learning on Real-Robot Hardware

【发表日期】2022.9.22

【论文链接】https://openreview.net/pdf?id=3k5CUGDLNdd

【推荐理由】从之前记录的数据中学习策略是现实世界机器人任务的一个有希望的方向,因为在线学习往往是不可行的。尤其是灵巧的操纵,在一般情况下仍然是一个开放的问题。然而,离线强化学习与大型多样化数据集的结合,有可能导致在这个具有挑战性的领域取得突破,就像近年来在监督学习中取得的快速进展一样。为了协调研究界解决这个问题的努力,本文提出了一个基准,包括:i)从一个灵巧的操纵平台上获得的关于两个任务的离线学习的大量数据,这些数据是通过在模拟中训练的有能力的RL智能体获得的;ii)在一个真实世界的机器人系统和模拟中执行学习的策略的选项,以便进行有效的调试。本文在数据集上评估了著名的开源离线强化学习算法,并为真实系统上的离线强化学习提供了可重复的实验设置。

内容中包含的图片若涉及版权问题,请及时与我们联系删除