在 Meta AI 近期举办的 Inside the Lab event 中,LeCun正在勾画构建人类级别AI的另一个愿景。LeCun提出,学习“世界模型”,即世界如何运作的内部模型的能力可能是关键。

LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构。该架构可以通过堆叠的方式进行更抽象、更长期的预测。LeCun 和 Meta AI 希望分层 JEPA 可以通过观看视频和与环境交互来了解世界是如何运行的。

深度学习大规模应用之后,人们一直期待真正的通用人工智能出现,能够带来进一步的技术突破。对此,Meta 首席科学家、图灵奖获得者 Yann LeCun 最近提出了一种新思路:他认为让算法预测世界内在运行规律的「世界模型」将是关键。他的思考引发了人们的关注。

Yann LeCun 的观点与 Kanai 等人提出的意识信息生成理论非常一致——智能源于能够生成世界复杂表示的能力(包括反事实)。卡耐基梅隆大学教授,前苹果 AI 研究主管 Russ Salakhutdinov 对此评价道:Josh Tenenbaum 和其他很多研究者在十年前已经开始研究世界模型,当时我在他的实验室做博士后。因此,当 Facebook 说他们正在研究基于世界模型的 AI 新愿景时,我觉得这听起来有点好笑。

LeCun 说,人和动物似乎能够通过观察和难以理解的少量互动,以一种独立于任务的、无监督的方式,学习大量关于世界如何运行的背景知识。可以假设,这些积累起来的知识可能构成了常识的基础。常识可以被看作是世界模型的集合,可以告诉我们什么是大概率会发生的,什么是可能发生的,以及什么是不可能发生的。

对于自主AI的模型架构,LeCun提出了如下猜想,它包含6个部分:配置器(configurator),感知器(perception),世界模型(world model),损耗(cost),行动器(actor),工作记忆(short-term memory)

对于感知器,LeCun做了进一步讨论,它需要从客观世界提取表观,并为行动器提供判别依据。

作为感知器和行动器的中间模块,工作记忆需要能够实现短期计划的归纳演绎。

同样地,作为自主AI中计算设备的损耗模块,需要能够为感知器、工作记忆、行动器进行自适应资源分配。

在演讲的第二部分,LeCun进一步阐述了早期提出的世界模型的动机:世界是随机变化的。

为了在世界模型中建模不确定性,LeCun再次强调了自监督学习的重要性。

自监督学习通过模型的非强监督,要求世界模型通过自监督函数学习不确定变化中体现的隐含约束。

最后,LeCun进一步说明了世界模型具有如下应用潜力:

当然,LeCun在宣讲结束时再次强调,世界模型、自主AI仍处于探索模块,现有技术仍存在许多难题尚未解决。

更多内容请参见宣讲视频与PPT

另外可以参考Meta AI的博客,还有机器之心的相关文章

内容中包含的图片若涉及版权问题,请及时与我们联系删除