- 简介人形机器人的全身控制(WBC)在技能多样性方面取得了显著进展,实现了包括运动行走、遥操作和动作追踪在内的广泛应用。尽管取得了这些成果,现有的WBC框架仍主要局限于特定任务,严重依赖耗时费力的奖励函数设计,且在不同任务与技能之间的泛化能力有限。这些局限性阻碍了系统对任意控制模式的响应能力,并限制了其在复杂真实场景中的部署应用。为应对这些挑战,我们重新审视了现有的WBC系统,并发现各类任务背后存在一个共通目标:生成恰当的行为,以引导机器人达到期望的目标状态。基于这一洞察,我们提出了行为基础模型(Behavior Foundation Model, BFM),这是一种在大规模行为数据集上预训练的生成式模型,旨在为人形机器人捕捉广泛且可复用的行为知识。BFM结合了掩码在线蒸馏框架与条件变分自编码器(CVAE),用于建模行为分布,从而能够在多种控制模式下灵活运行,并在无需从头开始重新训练的情况下高效习得新行为。在仿真环境和真实人形机器人平台上的大量实验表明,BFM能够在多种全身控制任务中实现稳健的泛化能力,并快速适应新行为。这些结果表明,BFM是迈向通用人形机器人控制基础模型的重要一步。
- 图表
- 解决问题现有的全身控制(WBC)框架大多任务特定,依赖繁琐的奖励工程,泛化能力差,难以应对多样化的控制模式和复杂真实场景中的多任务需求。这是一个长期存在但尚未根本解决的问题,尤其在迈向通用人形机器人控制的背景下愈发突出。
- 关键思路提出行为基础模型(BFM),将多种任务统一为生成导向目标状态的适当行为,通过大规模行为数据预训练生成模型,结合掩码在线蒸馏与条件变分自编码器(CVAE)建模行为分布,实现跨控制模式的灵活操作和新行为的快速获取,无需从头训练。相比以往任务专用设计,BFM首次尝试构建适用于人形机器人的通用行为先验模型。
- 其它亮点在仿真和真实人形机器人平台上进行了广泛实验,验证了BFM在多种WBC任务上的强泛化能力和快速适应新技能的效果;采用大规模行为数据集进行预训练,具备生成式建模优势;方法支持零样本或少样本迁移,展现出基础模型潜力;虽然未明确提及开源代码,但其框架设计为后续构建机器人通用行为模型提供了可复现路径,值得进一步扩展到更复杂环境与多模态指令融合方向。
- 1. 'A Generalist in the Physical World: Towards Universal Manipulation Policies', arXiv 2023 2. 'RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robot Control', arXiv 2023 3. 'Diffusion Policy: Visuomotor Policy Learning via Action Diffusion', RSS 2023 4. 'PaLM-E: An Embodied Multimodal Language Model', ICRA 2023 5. 'Learning Humanoid Policies with Diffusion and Autoregressive Models', CoRL 2023
沙发等你来抢
去评论
评论
沙发等你来抢