
2026 年,具身智能正以惊人速度从实验室验证向量产交付跨越,行业"出清"与产业筛选正在加速。
6 月 13 日,第 8 届智源大会"具身产业 CEO"论坛汇聚了五位演讲嘉宾与六位圆桌 CEO,围绕机器人大脑、数据闭环、商业落地路径展开深度碰撞。诸位 CEO 与创始人,通过自己的分享,共同回答着产业共同关心的焦点问题:究竟该如何正确理解具身智能产业所处周期?怎样成为具备商业闭环能力的具身企业?以及在这一轮商业化竞争中胜出的关键因素是什么?
郭彦东(智平方)
智平方创始人兼 CEO 郭彦东认为,能够跨场景、跨任务工作的机器人,将成为继汽车、PC、手机之后真正意义上的第四代智能终端。为实现这一目标,郭彦东指出,在当前技术阶段,将世界模型与 VLA 需要形成深度融合关系。其中,对物理世界 4D 理解(3D 结构+时序预测)的部分,将对机器人操作带来重要帮助。
基于郭彦东对世界模型内涵和外延的理解,智平方与北大联合推出的 Video2Act 在第三方 benchmark 上取得有效提升,已在汽车工业、半导体显示、生物制药等场景获得规模化订单,并以机器人店员形式在全国多个城市持续采集真实场景数据。
他进一步提出"类脑具身大模型"架构,将模型拆解为大脑皮层(世界理解)、小脑(稳定操作)、脊髓(快速执行)三层,实现主动感知与自我修复,并着重强调具身智能既离不开大脑也离不开可靠的硬件,一定要在真实场景中让机器人持续学习。

陈建宇(星动纪元)
具身智能从可用到可规模,走向产业落地价值兑现,靠的是整个系统都强;因此通用大脑与通用本体必须同步打造——这是星动纪元创始人兼 CEO、清华叉院助理教授陈建宇的核心判断。
模型层面,陈建宇梳理了三代具身大模型的范式演进:LLM 做上层规划→端到端 VLA→融合世界模型的 WAM。他同时在演讲中,展现了上述三个阶段,星动纪元的开创性工作,包括全球首个大语言模型结合人形机器人的学术工作,全球首个端到端 VLA 模型 HiRT,以及与 Physical Intelligence 创始人联合发布的 Ctrl-world。
本体层面,全栈自研 1.71 米、65kg、55 自由度人形机器人,最大关节扭矩 400 牛·米,曾获黄仁勋选为全球 14 强;五指直驱灵巧手单手可拎 24kg,遥操无延时。
同时,陈建宇也展示了星动纪元在商业上的当前进展:星动纪元同步的提供终端的解决方案以及开发的平台,并且已在物流仓库实现批量试运行,是行业首个 PMF 验证场景。

谢晨(光轮智能)
“数据不只是燃料,更是一套持续提供经验、反馈与因材施教的教育系统。” 在 2026 智源大会上,光轮智能创始人兼 CEO 谢晨博士提出这一独特判断。
谢晨博士指出,从大语言模型、自动驾驶到物理 AI,AI 产业的数据需求正在经历跨越式跃迁,但物理 AI 的底层逻辑与自动驾驶恰恰相反——机器人无法依赖本体回环,未来绝大多数数据将来自非本体数据,包括人类行为数据与仿真合成数据。基于此,他判断物理 AI 至少需要 10 亿个能够持续产生数据的数据生成器。
围绕这一判断,光轮智能正在通过 Real2Sim2Real 闭环,连接人类数据、物理准确仿真、规模化评测与部署反馈,构建面向物理 AI 的数据与评测基础设施。其核心产品体系覆盖 SimReady Foundry、EgoSuite、RoboFinals 与 RoboStack 四款产品,让机器人在经验、反馈与部署中持续学习、持续进化。
物理 AI 的教育系统,不可能由一家公司独自完成。2026 年 3 月,光轮智能作为唯一一家中国企业受邀加入国际开源 GPU 加速物理引擎 Newton 技术指导委员会(TSC),与 NVIDIA、Google DeepMind、Toyota Research Institute、Disney Research 共同推动下一代开源物理 AI 仿真标准建设;同时,光轮也在联合头显、灵巧手、触觉手套、传感器、计算平台等领域的全球领先厂商,共建开放的人类数据采集平台 HDCP,加速物理 AI 从研发走向产业落地。

朱兴(蚂蚁灵波)
蚂蚁灵波 CEO 朱兴表示,当前具身智能技术成熟度总体仍处于早期,目前只能在环境简单、任务比较单一的场景做小规模商业试点。相比大脑的进展,过去几年小脑和硬件发展更快。但是往前看,随着大脑更聪明,AI 将反向定义硬件。
围绕具身原生,朱兴重点讲了物理感知、高动态交互、泛化性不足三大挑战。对此,灵波发布了覆盖空间智能、灵巧操作和环境交互的全栈模型系列,1.0 系列已经于 1 月底开源,引起了广泛关注,GitHub Star 数超 1.5 万,技术报告被引用逾百次。在空间智能方向,着重解决机器人“看得更清楚”和“摸得更明白”的问题,针对反光、透明、密集摆放等复杂场景挑战,开源了基于深度补全技术的空间感知模型 LingBot-Depth 和 300 万对深度数据集。在高动态交互方向,着重解决机器人“想得更明白”的问题,发布了全球首个对标谷歌 Genie3 的开源世界模型 LingBot-World,由此衍生出让机器人"边推演边行动"的全球首个自回归视频-动作模型 LingBot-VA,该模型的论文已被 RSS2026 接收。在泛化性挑战方向,朱兴认为背后的核心就是数据挑战。针对行业关注的数据路线,朱兴将泛化挑战拆解为构型泛化、任务泛化、环境泛化三类,不同泛化挑战应该用不同数据配方。面向未来,朱兴坚定认为以人为中心的、且多模态对齐(视觉、触觉等)的数据极其重要。
此外,朱兴认为当物理数据达到一定程度,一定会催生属于物理智能自己的具身原生基础模型。具身原生也是灵波下一轮技术迭代的重点方向,全栈 2.0 预计会在下个月和大家见面。
模型的迭代除了科学 benchmark 牵引,蚂蚁灵波同步在积极推动商业试点落地,并将真实落地挑战带回到模型的训练迭代。目前,蚂蚁灵波的基模也已输送给乐聚等本体生态伙伴厂商,同步灵波自身也以进入家庭为长期目标在生活服务场景中沿途下蛋。

许华哲(破壳机器人)
破壳机器人创始人许华哲为成立仅三个月的破壳机器人选择了业内公认困难的家庭场景。
他在演讲中展示了“切豆腐”的视频 Demo,并预告 6 月 22 日将上线公司成立以来的第一个完整 demo"做一道麻婆豆腐",目标 2028 年 3 月让机器人走进家庭用户。
为了实现上述愿景,许华哲指出,技术上,破壳选择世界模型路线:通过推断未来观测再反推动作,让模型建立物理因果理解。针对世界模型的经典缺陷——物理幻觉与累计误差,团队提出 Action Forcing,通过修正,约束模型对同一动作的未来预测保持一致。

圆桌对话:资本、本体、数据、模型、场景的五重叩问
在所有嘉宾完成演讲后,本场论坛以圆桌对话作为收官环节。
智源研究院院长王仲远主持,论坛嘉宾为韩峰涛(千寻智能创始人 CEO)、周永(灵心巧手创始人 CEO)、刘东(星源智创始人 CEO)、许华哲(破壳机器人创始人)、朱兴(蚂蚁灵波创始人 CEO)五位。圆桌特别设置了举牌环节,嘉宾们态度鲜明,观点直接表达。
核心讨论围绕“当下具身智能最大的瓶颈是什么”展开。全场嘉宾就“解决数据瓶颈是重中之重”达成共识——韩峰涛直言千寻成立时就把数据当最重要的事,朱兴透露灵波从比 2 万小时大得多的数据中筛选、行业机制重复问题严重。
本场论坛中更多涌现的是关于共识问题的“非共识”解法。
对于本体是否成熟的的问题,韩峰涛认为阶段性硬件相对成熟(机械臂 50 分、AI 只有 3 分,但大模型可快速弥合),周永、刘东、许华哲则认为本体仍是“手搓”、一致性不稳定,朱兴中立但强调“AI 会反向定义硬件”。
从模型角度而言,许华哲提出,行业对“泛化”的期待过于乐观,体现在大家都认为自己模型好,但是掏不出来。。当前所谓泛化大多停留在环境泛化层面,真正的任务泛化和构型泛化还远未解决。
关于当务之急是进入到场景中去干活,还是先迭代基座模型的能力再往前去突破和推动,现场存在三个中立,一个同意,一个反对的分散意见。其中韩峰涛认为不要大规模进场景,但是要通过场景探索去反哺硬件和数据链;刘东则认为在训练基座模型的同时一定要在场景中找好适配可以落地的点从而避免跑偏。
提及当前的融资热潮和未来预期,韩峰涛直截了当指出:“今年本质是抢身份——具身即将进入大规模预训练阶段,今年没拿到头部估值,可能错过 Foundation Model 第一波窗口。”朱兴则相对谨慎,认为今年特定场景小规模商业试点“模糊可见”,明年会加速。

结语
五位演讲者,五位圆桌 CEO,五条技术路径,却指向同一个判断:2026 年是具身智能从 Demo 走向规模的关键大考之年。大脑要更聪明,数据要更丰富,本体要更可靠,场景要真正打透——缺了哪一环,飞轮就转不起来。
王仲远院长的最后一句话或许是最好的注脚:"苟富贵勿相忘——等你们发达了,智源大会接受赞助。"
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢