BridgeData V2: A Dataset for Robot Learning at Scale

解决问题:这篇论文旨在介绍BridgeData V2数据集,这是一个大规模的、多样化的机器人操作行为数据集,旨在促进可扩展机器人学习的研究。该数据集提供了广泛的任务和环境变化,使得机器人能够在不同的环境、领域和机构之间进行泛化,是广大研究人员的有用资源。

关键思路:论文的关键思路是介绍了BridgeData V2数据集,这是一个大规模、多样化的机器人操作行为数据集,可以用于训练各种开放词汇、多任务学习方法,这些方法可以以目标图像或自然语言指令为条件。相比当前这个领域的研究状况,这篇论文的思路在于提供了一个大规模、多样化的数据集,可以帮助研究人员更好地研究可扩展机器人学习。

其他亮点:这篇论文的亮点在于提供了一个大规模、多样化的机器人操作行为数据集,可以用于训练各种开放词汇、多任务学习方法。在实验中,作者使用了六种最先进的模仿学习和离线强化学习方法进行训练,并发现这些方法在需要不同程度泛化的任务套件上都取得了成功。作者还证明,这些方法的性能随着更多数据和更高容量的模型的使用而提高,而训练更多技能也会导致更好的泛化效果。作者公开了BridgeData V2数据集和他们的预训练模型,旨在加速可扩展机器人学习方法的研究。

相关研究:近期其他相关的研究包括:《Scaling Robot Supervision to Hundreds of Hours with RoboTurk: A Large-Scale Crowdsourcing Platform》(Bradly C. Stadie等,伯克利加州大学)、《Meta-Learning for Multi-Task and Few-Shot Learning》(Chelsea Finn等,斯坦福大学)等。

论文摘要:我们介绍了BridgeData V2,这是一个大规模、多样化的机器人操作行为数据集,旨在促进可扩展机器人学习研究。BridgeData V2包含60,096个轨迹,收集自一种公开可用的低成本机器人在24个环境中的操作。BridgeData V2提供了广泛的任务和环境变化,导致可以在环境、领域和机构之间进行泛化的技能,使数据集成为广泛研究人员的有用资源。此外,该数据集与许多基于目标图像或自然语言指令的开放词汇、多任务学习方法兼容。在我们的实验中,我们在数据集上训练了6种最先进的模仿学习和离线强化学习方法,并发现它们在需要不同程度泛化的一系列任务上均取得了成功。我们还证明,这些方法的性能随着更多数据和更高容量的模型而提高,而训练更多技能会导致更好的泛化。通过公开分享BridgeData V2和我们的预训练模型,我们旨在加速可扩展机器人学习方法的研究。项目页面位于https://rail-berkeley.github.io/bridgedata。

内容中包含的图片若涉及版权问题,请及时与我们联系删除