温馨提示点击下方图片,查看公众号“Robot猎场备忘录”运营团队(10月18日整理)原创报告(共182页)

图片
说明:欢迎行业人士交流、简历委托,行业交流记得先加入“机器人头条”知识星球,后添加(微信号:lietou100w)微信,备注“称呼+所在公司+职位”或者“已加入星球”(非备注,不添加);若有侵权请联系编辑运营(微信:Anna_J100)删除,若转载请注明出处;
——

正文:

2024 年人形机器人最具突破性的进展主要体现在具身智能领域,LLM多模态大模型的发展给机器人产业带来新一轮的机遇,通用人工智能(AGI)给人形机器人带来巨大变革。

人形机器人大致分为三大部分:人形本体、高动态性能的控制算法(小脑)、具有泛化性的具身智能及非常接近人的通用人工智能(机器人“大脑”

具身智能领域作为现阶段科技领域最火赛道之一,初创公司主要分三种:专注于具身智能大模型、人形机器人整机和两者同时涉及。

全球人形机器人本体公司背景可大体分为四类:汽车制造企业(特斯拉、小米等)、机器人企业(优必选、乐聚等)、科研院校孵化(星动纪元等)和互联网、智驾背景创业团队(星尘智能、Figure AI等),国内以科研院校教授“兼职”创业为主,国外更多是互联网背景创业团队。

全球具身智能大模型(机器人通用“大脑”)公司背景大体可分为:科技大厂(英伟达、OpenAI等)和科研院校背景创业团队(Physical Intelligence、Skild AI等)。

全球范围内,人形机器人本体初创公司最多(其中国内最多,并远超第二名是美国);具身智能大模型因涉及芯片、软件、AI算法,资金投入远高于人形机器人本体,目前更多是科技大厂间博弈,初创公司数量远远低于人形机器人本体初创公司;目前人形机器人本体初创企业多是依托科技大厂多模态大模型赋能。

特斯拉入局(Optimus)和人工智能、大模型技术突破性进展催生了本次具身智能浪潮。

2024年10月24日,特斯拉三季度财报会议上,马斯克表示:“我们拥有最先进的人形机器人。”同时表示:我们也是唯一一家真正具备大规模生产人形机器人所有必要条件的公司,因为其他公司缺少人工智能大脑,缺少真正实现大规模量产的能力;虽有令人印象深刻的视频演示,但缺乏本地化的人工智能,无法将生产规模扩大到非常高的数量。并进一步表示:我们将继续扩大我们的人工智能训练能力,以满足FSD和Optimus的需求;目前,我们并不受限于训练算力。

2024年6月13日,特斯拉2024年股东大会上,马斯克首次谈到人形机器人初创公司:原型很容易,批量生产很难,甚至不可能;并表示:特斯拉拥有生产能力、工程能力以及人工智能硬件和软件能力,将成为人形机器人域的领先者。

详细介绍,查看往期文章:马斯克:特斯拉是唯一一家真正具备大规模生产人形机器人能力的公司

特斯拉作为车企切入人形机器人赛道的确有天然优势(硬件设施+软件设施:团队、设备、技术和资金),并且已实现与特斯拉车辆技术同源。

软件层面,特斯拉人形机器人复刻智能驾驶技术路径;由于人型机器人算法与智能驾驶系统相类似,都是将AI能力赋能于复杂硬件设备,串联起众多传感器、运算芯片与执行器,因此Optimus 搭载了与特斯拉车辆相同的 FSD 智能驾驶系统,计算芯片移植了 HW3.0 智驾芯片,具备了完整的感知、决策规划、控制的循环链路。这也是特斯拉能够快速切入人形机器人领域的核心原因;

硬件层面:特斯拉自研 Dojo 超算平台支撑人形机器人的底层算力;特斯拉机器人Optimus 采用Dojo 超算平台作为底层 AI 算力支撑;特斯拉超级计算集群Cortex使Optimus不受限于训练算力;电池、摄像头、转向器、制动器等汽车核心零部件可复用于Optimus。

原特斯拉自动驾驶部门的负责人Andrej Karpathy近期访谈时表示:从本质上讲,汽车也是机器人;在从汽车到人形机器人Optimus的技术转移中,工作量其实不大,而且工具都是现成的,只是从汽车转移到机器人上,系统被重新配置,但本质上还是相同的;并且产品优先服务自家车厂,在工厂内进行技术孵化及完善,不需要与第三方签订合同,也不会涉及复杂的法律问题,可以完全内部操作,产品完善可商用后 ,在对外售卖。

然而,集诸多优势于一身的特斯拉,人形机器人Optimus进展并不顺利,商业化时间逐渐推迟外,有消息称人形机器人Optimus目前已经生产数百台,单台造价超10 万美元,但还不到可以上产线工作的状态,目前只能用来采集数据、测试不同的设计方案。

接下来小编将从软件算法、硬件(核心零部件)、工程化层面,盘点人形机器人商业化卡点。

软件层面:“大脑”、“小脑”

从底层算法模型来看,机器人的软件可以分为大脑与小脑;大脑负责感知外界并模拟人类思维决策过程,小脑则模仿生物进行复杂的运动控制;大脑部分主要职能是环境理解、智能交互与认知推理,基础是机器视觉、大语言模型的发展。

Source:创业邦研究中心

人工智能、大模型技术突破性进展催生了本身具身智能浪潮,但同时大模型发展瓶颈也同样是人形机器人商业化核心壁垒;相较于上游机器人核心零部件基本成熟,软件算法进步将是推动人形机器人功能提升和应用场景拓展的关键。

大模型的通识理解能力、多级推理能力赋予人形机器人具身智能的核心;嵌入在大模型中的庞大先验知识库&强大的通识理解能力让机器人更好理解泛化任务,且基于思维链的多级推理能力,让人形机器人实现了具身智能。

具身智能大模型(大脑)主要有两个路径:端到端具身大模型和分层端到端大模型。

目前来讲,大脑算法中的环境理解,基于机器视觉,发展相对成熟;规划决策算法是当前具身智能主要发展痛点,将伴随大模型的迭代而发展。

目前人形机器人本体初创企业多是依托科技大厂多模态大模型赋能。如:

Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大语言-视觉(VLM)模型、Apptronik旗下Apollo接入英伟达 GR00T人形机器人通用模型、乐聚机器人旗下“夸父”接入华为盘古具身智能大模型、优必选旗下walker S接入百度文心一言大模型、星动纪元旗下“小星”系列接入阿里通义千问和智谱清言两家大模型、智元机器人多模态通用大模型用的是讯飞星火大模型(操作大模型自研)、国地共建人形机器人创新中心自研朱雀大脑共集成 3 个大模型(科大讯飞星火大模型、上海人工智能实验室书生·浦语大模型和书生·万象多模态大模型)等。

Source:M2 Consulting

目前大小脑发展不均衡,相较于智能“大脑”的智力快速提升,灵巧“小脑”能够实现的灵巧操作能力亟待加强;小脑部分发展的制约因素包括精细运动执行尚未有统一的底层算法和数据采集。

运控算法:(具身智能最大壁垒之一)

人形机器人发展多年,从最初基于模型的控制算法(LIPM+ZMP),到动态模型控制和最优控制算法(MPC+WBC),目前正在向模拟学习+强化学习(IL+RL)演进,现阶段MPC+WBC控制方案仍旧是主流,各类算法没有绝对的替代关系,各有优劣;IL+RL路线是目前人形机器人公司最常提起的概念,也是目前人形机器人本体企业主要技术攻坚方向及后续主流控制方式,目前处于技术瓶颈阶段,难以短期突破,这也是诸多人形机器人本体公司推出轮式仿生机器人而不是双足人形机器人原因;运控模块(运控算法)是目前双足人形机器人公司核心技术壁垒。

类似ChatGPT 的 AI 大模型作为机器人大脑,只需要理解语意和人类交互,可采用的网络上文字、图像、视频等海量数据库训练数据;而具身智能机器人具备运动能力(机器人小脑),需要采集真实人类社会各个场景的数据——开门、做饭、清洁等居家场景,或会拧螺丝的工业场景,进而理解物理世界的运作规则。

对人形机器人来说,数据和场景是重点也是难点,数据量的缺乏导致小脑模型能力不足;人形机器人的落地需要有两套数据,满足物理世界的模型和机器人行为模型。

大规模数据Scaling Law需求与训练困难:(数据采集也是具身智能最大壁垒之一)

... ... ...

接下来小编继续从软件算法、硬件(核心零部件)、工程化层面,盘点人形机器人商业化卡点;从现阶段人形机器人企业产品(进展)、硬件设施(生产能力)、产品落地场景、企业官方宣布量产时间、盘点全球(含国内)人形机器人企业现况以及国内人形机器人发展乱象。

... ... ...

本文内容仅展示一部分,更多详细解读,扫码加入星球,查看完整版文章埃隆·马斯克首谈人形机器人创企:原型很容易,但生产很难,甚至不可能(全球创企量产能力浅析)并深度了解“具身智能&人形机器人”赛道

 

 

注:深度了解“具身智能&人形机器人”赛道,加入知识星球“机器人头条”交流学习

——

近期精选文章:

1、核心创始团队离开,「小米」、「小鹏」能否扛起国内人形机器人大旗

2、打破遥控质疑,特斯拉发布Optimus最新迭代视频!

3、浅谈,BATH切入人形机器人赛道

4、国内60+人形机器人初创企业,商业化进展为零!!!

5、北京、上海,争当人形机器人商业化“第一城”!

6、具身智能领域初创公司,最好结局可能是被收购!!!

7、ToB、ToC or ToG,全球人形机器人产品优选落地场景梳理!

8、特斯拉Optimus,揭开全球人形机器人商业化遮羞布!!

9、马斯克首谈人形机器人企业:原型很容易,但量产很难,几乎不可能!

10、近40款人形机器人亮相:谈商业化,为时尚早!谈量产,纯粹“噱头”!!

 

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除