$χ_{0}$: Resource-Aware Robust Manipulation via Taming Distributional Inconsistencies

2026年02月09日
  • 简介
    高可靠性的长时程机器人操作传统上依赖大规模数据与算力,以理解复杂的真实世界动力学。然而,我们发现制约真实场景鲁棒性的核心瓶颈,并非仅在于计算与数据资源的规模,而在于人类示范分布、策略所习得的归纳偏置(inductive bias)以及实际部署执行时的分布三者之间存在的分布偏移——这种系统性不一致会导致多阶段任务中误差持续累积、不断放大。为缓解上述不一致性,我们提出了 $χ_{0}$,一种资源高效、模块设计精当的框架,旨在实现面向工业落地的机器人操作鲁棒性。本方法建立在三大技术支柱之上:(i)模型算术(Model Arithmetic),一种权重空间融合策略,可高效吸收来自多样化示范数据的分布差异,涵盖物体外观变化、状态变化等各类变异性;(ii)阶段优势估计(Stage Advantage),一种具备阶段感知能力的优势函数估计器,能够提供稳定、稠密的任务进展信号,从而克服以往非阶段化方法在数值上的不稳定性;(iii)训推对齐(Train-Deploy Alignment),通过时空增强(spatio-temporal augmentation)、基于启发式的DAgger纠偏(heuristic DAgger corrections)以及按时间块进行的平滑处理(temporal chunk-wise smoothing),弥合训练与部署之间的分布鸿沟。借助 $χ_{0}$,两套双臂机器人可协同完成长时程服装操作任务,涵盖铺平、折叠、悬挂等多种衣物类型。本方法展现出高度可靠的自主运行能力:系统可从任意初始状态连续无间断运行达24小时。实验结果表明,在仅使用20小时训练数据和8块A100 GPU的前提下,$χ_{0}$ 的任务成功率较当前最优方法 $π_{0.5}$ 提升近250%。代码、数据集及预训练模型将全部开源,以推动社区发展。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图解决长时程双臂机器人服装操作中的高可靠性自主性问题,核心挑战并非算力或数据规模不足,而是人类示范分布、策略归纳偏置与真实部署执行分布之间的系统性不一致(distributional shift),导致多阶段任务中误差累积、鲁棒性崩溃。这是一个被长期忽视但对落地至关重要的新视角问题。
  • 关键思路
    提出χ₀框架,以资源高效方式系统弥合三大分布鸿沟:(i) Model Arithmetic——在权重空间融合异构人类演示(外观/状态差异),避免传统数据混合引入的冲突偏置;(ii) Stage Advantage——首次引入阶段感知的密集优势估计,替代不稳定、稀疏的端到端回报信号;(iii) Train-Deploy Alignment——通过时空增强、启发式DAgger修正和时序分块平滑,显式对齐训练与部署动态。其新意在于将‘分布一致性’作为第一性设计原则,而非事后调优。
  • 其它亮点
    在仅20小时真实双臂演示数据、8块A100 GPU下,实现24小时无中断连续服装操作(展平→折叠→挂衣);成功率较SOTA π₀.₅提升近250%;首次在真实双臂硬件上验证长时程(>100步)、开放形态(多品类衣物)、任意初始状态下的闭环鲁棒性;代码、数据、模型全部开源;值得深入的方向包括:权重空间分布融合的理论边界、阶段语义的自监督发现、以及面向物理交互的轻量化Train-Deploy Alignment泛化机制。
  • 相关研究
    Recent works include: 'RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control' (Google, 2023); 'VoxPoser: Composable Vision-and-Language Navigation with Large Language Models' (CMU & Stanford, 2023); 'Diffusion Policy: Visuomotor Policy Learning via Action Diffusion' (NVIDIA & UCSD, 2023); 'π₀.₅: Efficient Long-Horizon Imitation Learning for Dexterous Manipulation' (Berkeley, 2024); 'RoboCat: Data-Efficient Robotic Learning with Self-Improving Task Solvers' (DeepMind, 2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问