- 简介这项工作是朝着实现机器人在现实任务中达到人类水平的速度和表现的目标迈出了一步,并呈现了第一个在竞技乒乓球中达到业余人类水平表现的学习机器人代理。乒乓球是一项需要人类运动员经过多年训练才能达到高水平熟练度的体育运动。在本文中,我们贡献了(1)一个分层和模块化的策略架构,包括(i)低层控制器及其详细的技能描述符,模拟了代理的能力,并有助于弥合模拟与现实之间的差距,以及(ii)选择低层技能的高层控制器,(2)实现零样本模拟到现实的技术,包括一种迭代方法来定义基于现实世界的任务分布,定义自动课程,并(3)实时适应未知对手。通过29场机器人对人类的比赛评估了策略的表现,其中机器人赢了45%(13/29)的比赛。所有的人类选手都是未见过的,他们的技能水平从初学者到比赛水平不等。虽然机器人输给了最高级别的选手,但它赢了100%的初学者比赛和55%的中级选手比赛,表现出了坚实的业余人类水平表现。比赛视频可在https://sites.google.com/view/competitive-robot-table-tennis观看。
- 图表
- 解决问题实现机器人在乒乓球比赛中达到业余人类水平的表现
- 关键思路使用分层和模块化的策略架构,包括低级控制器和高级控制器,以及零-shot模拟到现实的技术和实时适应未知对手的能力
- 其它亮点在29场机器人对人类的比赛中,机器人赢了45%的比赛,证明了其具有相当的业余人类水平。实验设计中使用了自动课程表和真实对手,视频和代码也已经开源。
- 近期的相关研究包括《RoboCup@Home:从机器人到家庭的一步》、《机器人足球比赛中的深度强化学习》等。
沙发等你来抢
去评论
评论
沙发等你来抢