MuJoCo MPC for Humanoid Control: Evaluation on HumanoidBench

2024年08月01日
  • 简介
    我们使用MuJoCo MPC解决了最近引入的全身人形控制基准测试HumanoidBench。我们发现,HumanoidBench的稀疏奖励函数在优化时会产生不良和不现实的行为;因此,我们提出了一组正则化项,以稳定机器人在各种任务中的行为。目前对一部分任务的评估表明,我们提出的奖励函数可以在保持现实姿态和平稳控制信号的同时实现最高的HumanoidBench得分。我们的代码是公开的,并将成为MuJoCo MPC的一部分,可以快速原型设计机器人行为。
  • 图表
  • 解决问题
    本篇论文旨在解决HumanoidBench的稀疏奖励函数优化过程中出现的不稳定和不现实的问题,提出一组正则化项以稳定机器人的行为。
  • 关键思路
    论文提出了一组正则化项,用于稳定机器人的行为,从而解决了HumanoidBench的稀疏奖励函数优化过程中出现的问题。这种方法能够在保持稳定姿势和平滑控制信号的同时,实现最高的HumanoidBench得分。
  • 其它亮点
    论文提出的正则化项能够稳定机器人的行为,在实验中取得了最高的HumanoidBench得分。论文的代码是开源的,并将成为MuJoCo MPC的一部分,可以快速原型设计机器人行为。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如Learning to Run with AI,Deep Reinforcement Learning for Humanoid Robots等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论