【简介】

 Meta-World平台是由斯坦福,UC伯克利等大学及研究机构合作研发。提供了多种机器人任务及基线,为元学习的研究提供的很好的实验环境及基线。

【平台介绍】

元强化学习算法可以使机器人更快地掌握新技能,通过利用先前的经验来学习如何学习。然而,目前关于元强化学习的大部分研究都集中在非常狭窄的任务分布上。例如,一个常用的元强化学习基准将模拟机器人的不同运行速度作为不同的任务。当策略在这样狭窄的任务分布上进行元训练时,它们不可能泛化为更快地获取全新的任务。因此,如果这些方法的目的是能够更快地获取全新的行为,我们必须在足够宽泛的任务分布上对它们进行评估,以实现对新行为的泛化。在本文中,我们提出了一个用于元强化学习和多任务学习的开源模拟基准,由50个不同的机器人操作任务组成,目的是使其能够开发出泛化的算法,以加速获取全新的、持出的任务。我们在这些任务上评估了6种最先进的元强化学习和多任务学习算法。令人惊讶的是,虽然每个任务及其变化(例如,具有不同的对象位置)可以合理地成功学习,但这些算法难以同时学习多个任务,即使只有9个不同的训练任务。我们的分析和开源环境为未来多任务学习和元学习的研究铺平了道路,可以实现有意义的泛化,从而释放这些方法的全部潜力。

【平台展示】

【作者介绍】

内容中包含的图片若涉及版权问题,请及时与我们联系删除