- 简介我们提出了专家组合策略,这是一种可靠地扩展四足机器人代理技能库的框架。组合策略通过转换将一对专家连接到抽样的目标状态,使专家可以顺序组合。每个专家都专门从事单一技能,例如运动步态或跳跃动作。我们训练了一个单一的组合策略,而不是分层或混合专家架构,该过程独立进行,不受其他专家策略的限制。通过重复使用相同的组合策略,我们的方法可以在不影响现有专家的情况下添加新的专家,实现逐步的技能库扩展并保持原始动作质量。我们测量了72对转换的转换成功率,并实现了平均成功率为99.99%,比基线随机方法高出10%以上,并优于其他最先进的方法。在训练过程中使用域随机化,我们确保成功地将该方法转移到现实世界,在我们的实验中实现了平均转换成功率为97.22%(N = 360)。
- 图表
- 解决问题本论文旨在提出一种可靠地扩展四足机器人代理的技能库的框架,解决如何在不影响现有技能的情况下增加新技能的问题。
- 关键思路论文提出了一种专家组合策略,该策略通过与采样的目标状态链接专家对,使专家可以按顺序组合。通过重用相同的组合者策略,该方法使得能够添加新专家而不影响现有专家,从而实现逐步的库存扩展并保留原始运动质量。
- 其它亮点论文使用域随机化技术确保了实验结果的成功转移至实际世界。实验结果表明,该方法的平均转换成功率为99.99%,比基线随机方法高10%以上,并且优于其他最先进的方法。在实验中使用了72个转换对,实现了平均转换成功率为97.22%(N = 360)。
- 最近在这个领域中,还有一些相关的研究被进行,如《动态步态规划在四足机器人上的应用》、《基于深度学习的四足机器人运动控制研究》等。
沙发等你来抢
去评论
评论
沙发等你来抢