【标题】High-speed quadrupedal locomotion by imitation-relaxation reinforcement learning
【作者团队】Yongbin Jin, Xianwei Liu, Yecheng Shao, Hongtao Wang, Wei Yang
【发表日期】2022.12.14
【论文链接】https://www.nature.com/articles/s42256-022-00576-3
【推荐理由】腿式机器人的快速稳定运动涉及苛刻且矛盾的要求,特别是快速控制频率和精确的动力学模型。受益于神经网络的通用逼近能力和离线优化,强化学习已被用于解决有腿机器人运动中的各种具有挑战性的问题。然而,四足机器人的最优控制需要优化多个目标,如保持平衡、提高效率、实现周期性步态和服从命令等。这些目标不能总是同时实现,尤其是在高速情况下。浙江大学研究团队介绍了一种模仿放松强化学习 (IRRL) 方法来分阶段优化目标。为了弥合模拟与现实之间的差距,研究人员进一步将随机稳定性的概念引入系统鲁棒性分析中。状态空间熵递减率是一个定量指标,可以敏锐地捕捉到倍周期分岔的发生和可能出现的混沌。通过在训练和随机稳定性分析中使用 IRRL,我们能够证明 MIT-MiniCheetah 类机器人的稳定运行速度为5.0 m/s。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢