Catalyzing next-generation Artificial Intelligence through NeuroAI
多年来,神经科学一直是推动人工智能(AI)进步的关键驱动因素。本文作者提议,为了加速AI的进展,必须投资于神经AI的基础研究。其中的核心组成部分是具身图灵测试,它挑战AI动物模型以与其生活对应物类似的技能水平与感知-运动世界进行交互。具身图灵测试将重点从那些非常发达或独特的人类能力,如游戏和语言,转移到从5亿年的进化中继承的所有动物共享的能力上。建立能够通过具身图灵测试的模型将为下一代AI提供路线图。
标题:Catalyzing next-generation Artificial Intelligence through NeuroAI
论文:https://doi.org/10.1038/s41467-023-37180-x
作者:Anthony Zador, Sean Escola, Blake Richards, Bence Ölveczky, Yoshua Bengio, Kwabena Boahen, Matthew Botvinick, Dmitri Chklovskii, Anne Churchland, Claudia Clopath, James DiCarlo, Surya Ganguli, Jeff Hawkins, Konrad Körding, Alexei Koulakov, Yann LeCun, Timothy Lillicrap, Adam Marblestone, Bruno Olshausen, Alexandre Pouget, Cristina Savin, Terrence Sejnowski, Eero Simoncelli, Sara Solla, David Sussillo, Andreas S. Tolias & Doris Tsao
LeCun在得知此消息时却发推表示:已经out
长期以来,神经科学一直是人工智能改进的关键驱动力和灵感来源,尤其是那些使人工智能更加精通人类和其他动物擅长的领域,例如视觉、基于奖励的学习、与物理世界的交互以及语言。
然而,在典型的计算机科学课程中,很少提及神经科学对塑造冯诺依曼、图灵和其他计算家理论思想的影响。
神经人工智能(NeuroAI)是神经科学和人工智能的交叉点,将催化人工智能的下一次革命,最终导致人工智能的能力与人类相匹配,甚至可能超过人类。
近日,以美国冷泉港实验室(CSHL)为通讯单位的多位神经科学和人工智能领域的著名学者发表 Perspective 文章,建议为了加速人工智能的进步并发挥其巨大潜力,必须投入「NeuroAI」的基础研究。
其中的一个核心组成部分是具身图灵测试(Embodied turing test),它挑战 AI 动物模型,使其以类似于活体动物的技能水平与感觉运动世界进行交互。具身图灵测试将重点从那些特别发达或人类独有的游戏和语言等能力,转移到那些从 5 亿多年进化中继承下来的所有动物共有的能力。构建能够通过具身图灵测试的模型将为下一代人工智能提供路线图。
值得注意的是,该论文去年 10 月在 arXiv 预印上发表,引起一度热议。
2023 年 3 月 22 日正式以「Catalyzing next-generation Artificial Intelligence through NeuroAI」为题,发布在《Nature Communications》上。
文章分为以下几部分:
-
NeuroAI:神经科学和人工智能的交叉点
-
NeuroAI 大挑战:具身图灵测试(动物与环境互动、行为灵活、高效计算)
-
解决具身图灵测试的路线图
-
我们需要什么
-
结论
NeuroAI:神经科学和人工智能的交叉点
在未来几十年,AI 可能会像上世纪发生的计算机革命一样以一种深刻的方式改变社会和世界经济,而且速度可能会更快。这场 AI 革命为人类在现代经济中释放创造力提供了巨大的机会。人工智能系统的新进展可以使工人获得更高的生产力,并避免工人从事最危险和最卑微的工作。但是,为了实现这一目标,我们需要使 AI 获得类似人类的能力。
从历史上看,神经科学一直是 AI 进步的关键驱动力和灵感来源,尤其是人工智能更精通的领域,如视觉、基于奖励的学习、与物理世界的互动以及语言方面等,这些领域人类和动物也很擅长。人工智能依然可以扮演这个角色,但为了加速 AI 的发展并实现其巨大潜力,必须投入「NeuroAI」的基础研究。
几十年前,当时的研究人员为试图了解大脑是如何计算的而埋下了人工智能的种子。几十年后的今天,人工神经网络和强化学习的应用发展迅速,以至于很多观察者都认为人工智能的长期目标——通用人工智能已经实现了。然而,领域内的人士则认为,在我们建立类似人类、甚至小鼠这样的人工智能系统之前,我们仍需在这个领域取得新的突破,因为现有的人工智能系统尚不能完成类似小鼠的所有任务。
虽然许多关键的人工智能进步,如卷积人工神经网络和强化学习,都受到了神经科学的启发,但目前机器学习领域的许多研究都在遵循自己的道路,建立在之前开发的方法基础上,这些方法是受数十年来神经科学的发现而启发,例如受到大脑中注意力机制启发的基于注意力的神经网络。现代神经科学产生了新的影响,但它们是由少数研究人员带头的。因此在 AI 的发展中错失了很多机会。在过去几十年中,通过 NIH, BRAIN 计划等努力,我们积累了大量关于关于支撑自然智能的解剖学和功能结构的大脑知识。
NeuroAI 是神经科学和人工智能的交叉点,这一新兴领域基于一个前提:对神经计算的更好理解将揭示智能的基本成分,并催化人工智能的下一次革命,最终导致人工智能的能力与人类相匹配,甚至可能超过人类。我们认为,现在是大规模进行识别和理解生物智能原理的恰当时机,并将这些原理抽象出来用于计算机和机器人系统。
尽管人们倾向于关注智能行为中最具人性特征的方面,例如抽象思维和推理,并且从稀疏观察中做出一般推断的能力已经以某种形式存在于已经进化了数亿年的基本感觉运动环路中。正如人工智能先驱 Hans Moravec 所说,抽象思维「是一种新的把戏,也许不到 10 万年的历史......有效的唯一原因是它得到了更古老、更强大、但通常是无意识的感觉运动知识的支持」,小鼠和非人灵长类动物可以作为自然智能的实验模型。如果人工智能能够匹配他们看似简单的感知能力和运动能力,那么通往人类智能水平的步伐将大大缩短。因此我们相信,如果我们弄清所有动物与世界互动的核心能力,NeuroAI 将带来必要的进步。
NeuroAI 大挑战:具身图灵测试
1950 年,阿兰·图灵(Alan Turing)提出了模仿游戏,以测试机器是否能表现出与人类行为相当或者无法区分的智能。那场比赛,现在广泛被称为图灵测试 (Turing test) ,在比赛中,机器被训练来模仿人类的反应,并要求人类裁判评估真人和机器之间的对话的自然程度。通过专注于对话能力,图灵回避了机器是否可以「思考」的问题,他认为这是一个无法回答的问题。图灵测试基于这样一种隐含的信念,即语言代表了人类智能的顶峰,能够对话的机器一定是智能的。
直到最近,还没有任何人工系统能够接近通过图灵测试。然而,一类称为「大型语言模型」的现代人工智能系统现在可以进行令人惊讶的有说服力的对话。在某种程度上,「大型语言模型」的成功揭示了我们是多么容易被欺骗,将智慧、能动性甚至意识强加给我们的对话者。尽管这些系统令人印象深刻,因为它们并非基于现实世界的经验,但它们仍然在因果推理和物理常识的许多基本方面继续挣扎。因此,图灵测试并没有探索我们与物理世界互动和推理的惊人感知和运动能力,与动物共享的能力,以及通过无数代自然选择磨练出来的能力。
因此,研究人员提出了一种扩展的「具身图灵测试」,包括高级感觉运动能力。最初的图灵测试的精神是建立一个简单的定性标准,据此可以判断我们在构建人工智能机器方面的进展。这种具体的图灵测试将对人工系统与人类和其他动物与世界的交互进行基准测试和比较。依据每种动物自己独特的能力定义了各自的图灵测试:可以测试人造海狸建造水坝的能力,测试人造松鼠跳过树的能力。尽管如此,几乎所有动物都具有许多核心感觉运动能力,动物快速进化适应新环境所需的感觉运动技能的能力表明,这些核心技能提供了坚实的基础。这意味着,在开发出忠实再现一个物种行为的 AI 系统之后,将该系统适应其他物种——甚至人类——可能会很简单。下面重点介绍一些跨物种共有的特征。
动物与环境互动
动物的典型特征在于能够以有目的四处移动并与环境互动。尽管最近在最优控制、强化学习和模仿学习方面取得了进展,但机器人技术在控制身体和操纵物体方面仍远未达到动物水平,即使在模拟中也是如此。当然,神经科学可以提供关于模块化和分层架构的种类的指导,这些架构可以适应人工系统以赋予它们这些能力。神经科学还可以为我们提供设计原则,例如部分自主(partial autonomy)和摊销控制(partial autonomy)。这些原则可以指导系统的感知、动作选择、运动和四肢、手和手指的精细控制的设计。了解特定的神经回路如何参与不同的任务也可以为其他形式的「智能」提供解决方案,包括更多的认知领域。
动物行为灵活
另一个目标是开发 AI 系统,该系统能够类似单个动物的行为范围,参与大量灵活多样的任务。现代 AI 可以很容易地学会在 Breakout 等视频游戏中超越人类,只需要使用屏幕上的像素和游戏分数。然而,与人类玩家不同,这些系统脆弱且对小扰动高度敏感:稍微改变游戏规则,甚至改变输入的几个像素,都可能导致灾难性的糟糕表现。这是因为这些系统学习了从像素到动作的映射,不需要理解游戏中的智能体和对象以及控制它们的物理原理。同样,自动驾驶汽车本身并不知道箱子从前面的卡车上掉下来的危险,除非它确实看到箱子从卡车上掉下来导致不良后果的例子。即使它接受过关于板条箱掉落危险的训练,系统可能会把前面汽车里吹出来的一个空塑料袋视为一种障碍,从而不惜一切代价避免,同样,因为它不会真正了解什么是塑料袋,也不知道它在物理上有没有威胁。这种无法处理未出现在训练数据中的场景是对广泛依赖人工智能系统的重大挑战。
为了在不可预测和不断变化的世界中取得成功,智能体必须灵活,并通过使用其关于此类情况可能如何展开的一般知识来掌握新情况。这可以说是动物的行为。动物天生就具备茁壮成长所需的大部分技能,或者可以从有限的经验中迅速获得这些技能,这得益于它们在进化和发展过程中在现实世界互动方面的强大基础。因此,很明显,为特定任务从头开始训练并不是动物获得令人印象深刻的技能的方式;动物并不是一无所有的来到这个世界上,然后依靠大量标记的训练集来学习。尽管机器学习一直在寻求避开这种白板限制的方法,包括自我监督学习、迁移学习、持续学习、元学习、一次性学习和模仿学习,但这些方法都无法达到大多数动物的灵活性。因此,我们认为,理解为现实世界(即使是简单动物)的行为灵活性提供基础的神经回路级原理,有可能大大提高人工智能系统的灵活性和实用性。换句话说,我们可以利用进化已经参与的优化过程,大大加快我们对现实世界交互的通用环路的搜索。
动物高效计算
现代 AI 面临的一项重要挑战是能源效率,我们的大脑已经克服了这一挑战。训练神经网络需要大量的能量。例如,训练 GPT-3 等大型语言模型需要超过 1000 兆瓦时的电力能源,足以为一个小镇供电一天。相比之下,生物系统的能源效率要高得多:人脑使用大约 20 瓦。
大脑和计算机之间能量需求的差异源于信息处理的差异。首先,在算法层面,现代大规模 ANN,例如大型语言模型,依赖于非常大的前馈架构,这些架构具有自注意力来处理随时间变化的序列,而忽略了递归处理序列信息的潜在能力。原因之一是目前我们没有在循环网络中进行信用分配计算的有效机制。相比之下,大脑利用灵活的循环架构可以高效地解决时间信用分配问题。揭示发生这种情况的机制可能使我们能够提高人工系统的能源效率。其次,在实现层面,神经回路不同于数字计算机。尽管存在不可靠或「嘈杂」的组件,神经电路仍能有效计算。
解决具身图灵测试的路线图
如何开发通过具身图灵测试的人工系统?一种自然的方法是在人类进化史的指导下逐步进行。
这种进化的观点提出了一种通过具身图灵测试的策略,方法是将其分解为一系列相互构建的渐进式挑战性增量测试,并在此系列上迭代优化。
这些人工智能体的性能可以与动物的性能进行比较。现在已经收集了代表大量物种行为图的丰富行为数据集,并且可以将其部署为特定物种具身图灵测试的基准性能。此外,详细的生物力学测量支持高度逼真的动物身体模型。结合功能强大、快速的物理模拟器和虚拟环境的开源,这些模型将为具身图灵测试研究提供在计算机上大规模执行的机会。最后,现有广泛的神经数据集在行为期间跨多个大脑区域同时进行神经记录,结合越来越详细的神经解剖学和连接组学,为 AI 系统的设计提供了强大的路线图,这些系统可以控制虚拟动物来概括它们在体内对应的行为,从而通过具身图灵测试。
重要的是,每个物种的具身图灵测试的细节可以根据不同研究小组的需要进行调整。我们可以在感觉运动控制、自我监督和持续学习、泛化、短期和长期时间尺度上的记忆引导行为以及社会互动方面测试人工智能系统的能力。构成图灵测试的挑战可以标准化,以允许量化进展和研究成果之间的比较。最终,通过在机器人技术方面的额外努力,展示成功再现感兴趣行为的虚拟有机体可以适应物理世界,并用于解决现实世界的问题。
我们需要什么
实现这些目标需要在三个主要领域部署大量资源。
首先,我们必须培养新一代在工程/计算科学和神经科学方面同样精通的人工智能研究人员。这些研究人员将利用神经科学数十年来的进步,为人工智能研究开辟全新的方向。最大的挑战将是确定如何利用神经科学、计算科学和其他相关领域的协同作用来推进我们的探索:确定大脑回路、生物物理学和化学的哪些细节是重要的,以及在人工智能的应用中可以忽略哪些细节。因此,迫切需要接受过 AI 和神经科学双重培训的研究人员应用神经科学的见解来推进 AI,并帮助设计产生与 AI 相关的新见解的实验。
其次,我们必须创建一个能够开发和测试这些虚拟智能体的共享平台。在创建迭代的、具身图灵测试和进化人造有机体以通过测试时,我们将面临的最大技术挑战之一是所需的计算能力。这将需要一个重大的组织努力,得到政府的支持,最好还有行业的支持,其核心目标是在动物和类人智能方面取得科学进展。
第三,要支持神经计算的基础理论和实验研究。利用神经科学和人工智能之间强大的协同作用需要项目和基础设施支持,以组织和支持大规模的跨学科研究。要利用神经科学和人工智能之间强大的协同作用,需要项目和基础设施的支持,以组织和实现跨学科的大规模研究。
幸运的是,目前政界已达成广泛共识,即对人工智能研究的投资对人类的技术未来至关重要。通过现有实体或作为独立机构创建总体指令,以支持 NeuroAI 和 AI 研究将推动这一使命,从而释放 AI 造福人类的潜力。
结论
尽管神经科学推动 AI 进步的历史悠久且未来进步潜力巨大,但该领域的大多数工程师和计算科学家都没有意识到这一历史和机遇。在典型的计算机科学课程中,很少提及神经科学对塑造冯诺依曼、图灵和其他计算机学家思想的影响。
NeurIPS 等人工智能顶级会议之前展示了很多计算神经科学和机器学习结合的最新进展,但是近年来 NIPS 越来越关注纯粹的机器学习技术。
「工程师不会为了制造更好的飞机而研究鸟类」这句老话作为类比是失败的,部分原因是航空先驱确实研究过鸟类,有些人仍在研究。此外,这个类比在更根本的层面上也是失败的:现代航空工程的目标不是实现「鸟级」飞行,而 AI 的一个主要目标确实是实现(或超过)「人类级」智能。正如计算机在许多方面超过人类一样,飞机在速度、航程和载货量等特性方面也超过鸟类。然而,如果航空工程师的目标确实是制造一种具有「鸟类水平」能力的机器,可以飞过茂密的森林树叶并轻轻降落在树枝上,那么他们最好密切关注鸟类是如何做到的。同样,如果 AI 的目标是实现动物级别的常识感觉运动智能,那么研究人员最好向动物学习以了解他们如何在不可预测的世界中进化出行为方式。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢