【标题】Learning High Speed Precision Table Tennis on a Physical Robot

【作者团队】Tianli Ding, Laura Graesser, Saminda Abeyruwan, David B. D'Ambrosio等

【发表日期】2022.10.07

【论文链接】https://arxiv.org/pdf/2210.03662.pdf

【推荐理由】为将机器人学习应用需要紧密循环的动态、高速人机交互任务中,谷歌研究利用乒乓球这一速度和精度双重要求很高的运动来进行训练机器人交互和强化学习的研究。在现实世界中学习目标条件控制是机器人技术中一个具有挑战性的开放问题。强化学习系统有可能通过试错法自主学习,但在实践中,手动奖励设计、确保安全探索和超参数调整的成本通常足以阻止现实世界的部署。另一方面,模仿学习方法提供了一种在现实世界中学习控制的简单方法,但通常需要昂贵的策划演示数据,并且缺乏持续改进的机制。谷歌研究团队发现,迭代模仿学习可以在动态环境中扩展到真实机器人上的目标导向行为:高速、精确的乒乓球。研究人员发现这种方法提供了一种直接的方式来进行持续的机器人学习,而没有奖励设计或模拟到真实的迁移等复杂性,同时它也是可扩展的——样本效率足以在几个小时内训练一个物理机器人。