- 简介在各种地形上实现敏捷且具有泛化能力的足式运动,需要感知与控制的高度融合,尤其是在存在遮挡和落足点稀疏的情况下。现有方法虽已在跑酷任务中展现出一定的运动敏捷性,但通常依赖端到端的感控一体化模型,其泛化能力和可解释性有限。相比之下,专注于提升泛化能力的方法往往敏捷性不足,且难以应对视觉遮挡问题。本文提出 AME-2,一种面向敏捷与泛化运动的统一强化学习(RL)框架,该框架在控制策略中引入了一种新颖的基于注意力机制的地图编码器。该编码器能够提取局部与全局地图特征,并利用注意力机制聚焦于显著区域,从而为基于强化学习的控制生成具备可解释性和泛化能力的状态嵌入。此外,我们还提出一种基于学习的地图构建流程,可快速生成对噪声和遮挡具有鲁棒性的、包含不确定性信息的地形表征,并作为策略的输入。该流程使用神经网络将深度观测转换为带有不确定性的局部高程图,并将其与里程计数据进行融合。同时,该流程还集成了并行仿真机制,使得控制器可以在在线建图条件下进行训练,有助于提升从仿真到现实的迁移效果。我们在四足和双足机器人上结合所提出的地图构建流程对 AME-2 进行了验证,实验结果表明,所得控制器在仿真和真实环境中均表现出优异的运动敏捷性,并能有效泛化至未见过的复杂地形。
-
- 图表
- 解决问题论文旨在解决腿式机器人在复杂地形中实现敏捷且通用的运动控制问题,尤其是在存在视觉遮挡和稀疏 foothold 的情况下。现有方法要么依赖端到端传感器-运动模型而缺乏泛化性和可解释性,要么虽具泛化能力但敏捷性不足且难以应对感知不确定性。这是一个尚未完全解决的重要问题,尤其在真实世界部署中尤为关键。
- 关键思路提出 AME-2,一种统一的基于强化学习(RL)的框架,其核心创新是在控制策略中引入基于注意力机制的地图编码器(attention-based map encoder),能够提取局部与全局地图特征并聚焦于显著区域,从而生成可解释、可泛化的状态嵌入。同时设计了一个学习型建图流水线,将带不确定性的深度观测与里程计融合,生成鲁棒的地图表示,并支持在线建图与仿真训练,提升sim-to-real迁移能力。相比以往工作,该方法在保持高敏捷性的同时显著增强了泛化能力和对遮挡的鲁棒性。
- 其它亮点亮点包括:1)所提建图流水线能输出带不确定性的地形表示,对噪声和遮挡具有鲁棒性;2)注意力机制使策略具备可解释性,可可视化关注区域;3)系统在仿真和真实世界中均验证于四足和双足机器人,展示了卓越的跨地形泛化能力;4)通过并行仿真支持在线建图训练,有效促进sim-to-real迁移;5)实验涵盖多种未见地形,验证了系统的通用性与敏捷性。目前未提及代码是否开源,值得后续关注。未来可深入研究方向包括扩展至更多类型机器人、结合语义感知以及在动态环境中应用。
- 1. Learning to Navigate Unstructured Terrain with Attention-Based Control 2. Legged Locomotion in Complex Environments: A Survey 3. Perception-Aware Model Predictive Control for Agile Legged Robots 4. ANYmal in the Wild: Learning Reactive Locomotion with Latent Space Representations 5. Rapid Motor Adaptation for Dynamic Legged Locomotion 6. Vision-Based Global Localization and Mapping for Legged Robots Using Deep Elevation Estimation
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流