$χ_{0}$: Resource-Aware Robust Manipulation via Taming Distributional Inconsistencies

向作者提问

NEW

简介

高可靠性的长时程机器人操作传统上依赖大规模数据与算力，以理解复杂的真实世界动力学。然而，我们发现制约真实场景鲁棒性的核心瓶颈，并非仅在于计算与数据资源的规模，而在于人类示范分布、策略所习得的归纳偏置（inductive bias）以及实际部署执行时的分布三者之间存在的分布偏移——这种系统性不一致会导致多阶段任务中误差持续累积、不断放大。为缓解上述不一致性，我们提出了 $χ_{0}$，一种资源高效、模块设计精当的框架，旨在实现面向工业落地的机器人操作鲁棒性。本方法建立在三大技术支柱之上：（i）模型算术（Model Arithmetic），一种权重空间融合策略，可高效吸收来自多样化示范数据的分布差异，涵盖物体外观变化、状态变化等各类变异性；（ii）阶段优势估计（Stage Advantage），一种具备阶段感知能力的优势函数估计器，能够提供稳定、稠密的任务进展信号，从而克服以往非阶段化方法在数值上的不稳定性；（iii）训推对齐（Train-Deploy Alignment），通过时空增强（spatio-temporal augmentation）、基于启发式的DAgger纠偏（heuristic DAgger corrections）以及按时间块进行的平滑处理（temporal chunk-wise smoothing），弥合训练与部署之间的分布鸿沟。借助 $χ_{0}$，两套双臂机器人可协同完成长时程服装操作任务，涵盖铺平、折叠、悬挂等多种衣物类型。本方法展现出高度可靠的自主运行能力：系统可从任意初始状态连续无间断运行达24小时。实验结果表明，在仅使用20小时训练数据和8块A100 GPU的前提下，$χ_{0}$ 的任务成功率较当前最优方法 $π_{0.5}$ 提升近250%。代码、数据集及预训练模型将全部开源，以推动社区发展。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图解决长时程双臂机器人服装操作中的高可靠性自主性问题，核心挑战并非算力或数据规模不足，而是人类示范分布、策略归纳偏置与真实部署执行分布之间的系统性不一致（distributional shift），导致多阶段任务中误差累积、鲁棒性崩溃。这是一个被长期忽视但对落地至关重要的新视角问题。
关键思路

提出χ₀框架，以资源高效方式系统弥合三大分布鸿沟：(i) Model Arithmetic——在权重空间融合异构人类演示（外观/状态差异），避免传统数据混合引入的冲突偏置；(ii) Stage Advantage——首次引入阶段感知的密集优势估计，替代不稳定、稀疏的端到端回报信号；(iii) Train-Deploy Alignment——通过时空增强、启发式DAgger修正和时序分块平滑，显式对齐训练与部署动态。其新意在于将‘分布一致性’作为第一性设计原则，而非事后调优。
其它亮点

在仅20小时真实双臂演示数据、8块A100 GPU下，实现24小时无中断连续服装操作（展平→折叠→挂衣）；成功率较SOTA π₀.₅提升近250%；首次在真实双臂硬件上验证长时程（>100步）、开放形态（多品类衣物）、任意初始状态下的闭环鲁棒性；代码、数据、模型全部开源；值得深入的方向包括：权重空间分布融合的理论边界、阶段语义的自监督发现、以及面向物理交互的轻量化Train-Deploy Alignment泛化机制。
相关研究

Recent works include: 'RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control' (Google, 2023); 'VoxPoser: Composable Vision-and-Language Navigation with Large Language Models' (CMU & Stanford, 2023); 'Diffusion Policy: Visuomotor Policy Learning via Action Diffusion' (NVIDIA & UCSD, 2023); 'π₀.₅: Efficient Long-Horizon Imitation Learning for Dexterous Manipulation' (Berkeley, 2024); 'RoboCat: Data-Efficient Robotic Learning with Self-Improving Task Solvers' (DeepMind, 2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问