【作者团队】Dmitry Kalashnikov, Jake Varley, Yevgen Chebotar
【论文链接】https://openreview.net/pdf?id=p9Pe-l9MMEq
【推荐理由】通用机器人系统必须掌握大量的各种技能。虽然强化学习为获取个体行为提供了一个强大的框架,但获取每项技能所需的时间使得采用 RL 训练的通用机器人前景不容乐观。本文研究了大规模集体机器人学习系统如何同时获得一系列行为,跨任务共享探索、经验和表示。在此框架中,可以从先前学习的任务中不断实例化新任务,从而提高系统的整体性能和能力。为了实例化这个系统,本文开发了一个可扩展且直观的框架,用于通过用户提供的期望结果示例来指定新任务,设计一个用于数据收集的多机器人集体学习系统,该系统同时收集多个任务的经验,并开发一种可扩展且可推广的多任务深度强化学习方法-MT-Opt。本文展示了 MT-Opt 如何学习广泛的技能并在真实世界任务上训练和评估了此系统。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢