摘 要

在人工智能发展的潮流中,符号主义一直处于引导的地位,在不同的历史时期也创造了优秀的代表性成果。然而符号主义下的人工智能并没有达到可以使计算机像人类一样去思考问题的高度,想要计算机模拟人类的方式进行思考,先要理解人类思考的方式,人类思考问题就是基于抽象的概念的,简单概念堆叠成复杂概念,无数的概念再一层一层地搭建起了人的认知架构,概念与概念之间的关系组成观念,观念与观念互相联系,形成了逻辑自洽的认知网络,即构成了人的思想。另外,机器学习是现阶段解决很多人工智能问题的主流方法,作为一个独立的方向,正处于高速发展之中。然而,目前机器学习的主流算法都只能被用于单一的应用场景,因此,本文主要介绍了符号和符号主义的概念、符号主义是如何在认知架构中发挥作用,阐述了机器学习的优势及不足,思考符号主义与机器学习如何有机结合并在认知中发挥作用。

关键词:符号主义 机器学习 认知 人工智能

 

一、何为符号?何为符号主义?

理解符号主义,首先要理解符号的含义。那么符号是什么呢?所谓符号就是模式。任一模式,只要他能与其他模式相区别,就是一个符号 [1] 。例如,“猫”作为一个符号,这个符号代表外部世界中猫的群体。当我们在现实生活中看到猫这种个体时,我们会自然用“猫”这个符号去对其进行表征。从集合的角度去理解,每个符号可以表征一个群体的集合,不同的符号即代表不同的群体,而每个群体中的每个个体,就是该集合中的每个元素。同样引用“猫”的例子,假设“猫”这个符号表征现实中我们见到的猫的群体,则该符号就相当于一个名称为“猫”的集合,而每一只猫,都是该集合中的唯一元素。由符号的实体集合构成的系统称为物理符号系统,它是一台随时间运行处理符号集合结构体的机器 [2] 。物理包括了两个重要的特征:这个系统严苛遵从物理规律-系统是由工程系统和工程元件构成,所以这个系统是稳定的;尽管使用符号这个词来表明我们原来的意图,当系统并不局限于人类符号系统 [3] 。因此,首先,物理符号系统具有稳定性,即系统中的符号实体是固定的,且每个符号实体所表征的群体是固定的;其次,符号既可以是物理符号,也可以是抽象符号。例如数理逻辑就是一个物理符号系统:它的符号是一系列的单词例如“且”、“或”、“非”、“所有的”、“存在”等等;再比如国际象棋:它的符号就是棋盘中的每个棋子。

符号具有双重属性:1、表征外部事物的功能;即每个符号都具有表征特定的外部事物的群体的作用,某一群体由于某些相同的特征被相同的符号表征,不同群体由于群体间的不同特征被不同的符号表征。2、自身具有物理或形式上的特征,可以标志信息加工的操作。每个符号都有特定的所指或者意指,对不同的符号进行操作代表着对不同信息进行处理或加工。

目前,人工智能主要有三大学派,即符号主义、联结主义和行为主义。符号主义(Symbolism)是一种基于逻辑推理的智能模拟方法,又称为逻辑主义(Logicism)、心理学派(Psychlogism)或计算机学派(Computerism)。所谓符号主义,该学派认为:人类认知和思维的基本单元是符号,而认知过程就是在符号表示上的一系列操作。假设人是一个物理符号系统,计算机也是一个物理符号系统,基于物理符号系统的稳定性,计算机可以通过对符号进行操作来模拟人的认知和思维,完成类人的智能行为。这种方法的实质就是模拟人的左脑抽象逻辑思维,通过研究人类认知系统的功能机理,用某种符号来描述人类的认知过程,并把这种符号输入到能处理符号的计算机中,就可以模拟人类的认知过程,从而实现人工智能。可以把符号主义的思想简单的归结“认知即计算”。由于这种对人工智能的解释符合大部分人的认知,因此符号主义在人工智能领域一直处于主导地位。

表一 人工智能的三大学派

 

二、何为符号操作机制?如何使用符号操作机制构建认知框架?

符号操作机制,顾名思义,就是对物理符号系统中的符号进行运算或加工的一系列操作。这里有几个值得我们思考的问题:符号操作机制从何而来?它在人类的认知过程中起到了什么样的作用?首先探讨符号操作机制的来源。符号加工机制从何而来的问题可以从两方面来理解:符号加工机制是如何在儿童身上发展起来的,以及符号加工机制是如何在人类身上发展起来的。加里.马库斯在他的《代数思维》中持有这样一种观点:在儿童接触外部世界并获得经验之前,符号加工机制就已经包含在一套对于他们来说天生可用的事物中。简而言之,我们的大脑天生就拥有一套符号加工机制,也就是说,符号加工是人类大脑中固有的设计的一部分。不妨假设我们天生拥有一套与环境互动的机制,一套从世界中提取知识的工具,一套利用知识的工具。如果没有天生的学习工具,就根本不会有学习。我们将这套工具称为符号操作机制,当我们暴露在环境中时,我们使用这种机制对环境中的个体进行表征,并从外部世界自发地进行学习。相信某些事物是天生的一个原因是,可能没有其他令人满意的解释来说明一种已知的知识是如何产生的。当然,符号加工机制是否是人类与生俱来地并未得到验证,不过倘若用这种观点去解释大多数现象得到地结果都是合理地。关于符号操作机制是如何构建的,其中最明确的观点是,遗传密码指定了一份密码本,告诉每个脑细胞它应该是什么样的神经元,以及它应该如何连接到其他神经元。加里.马库斯对符号操作机制做出了三个假设:第一,大脑表示变量之间的抽象关系;符号操作机制处理的便是变量的关系,既然符号操作机制是大脑固有的设计,那么大脑理所应当地可以表征变量之间或抽象或具象的关系;第二,大脑具有递归结构化表示的系统;大脑可以根据已习得的知识对新的事物进行表征,以一种递归式结构用符号表征对象;第三,大脑区分个体的心理表征和种类的心理表征;简而言之,大脑具有的符号操作机制,可以从心理表征的角度对个体和种类进行符号表征。

符号学的支持者表示,人类所具有的知识都是具有某种形式(具象或者抽象)的信息,所有的知识都可以通过符号(语言或者非语言)表征出来,而数理逻辑则是用符号表征知识的典型形式,将符号学理论与人工智能及其应用结合起来,便出现了人工智能领域的符号主义纲领。

那么,符号操作机制是如何在认知过程中发挥作用的呢?说到底,人类的认知过程说就是一个对符号进行操作(运算、加工等处理)的过程,用符号操作的过程来模拟人脑对信息处理的过程。因为人类对世界的认知离不开理性的推理过程,而理性的推理过程可以通过形式化的语言尤其是数理逻辑来完成,其中数理逻辑的表征归根结底是符号表征。认知学大师赫伯特·西蒙在四个维度回答这个问题:一是善用跨学科的思维;认知涉及的领域众多,无论是传统的心理学还是行为主义,在解释认知的过程中都有一定的局限性,因此西蒙开创性的引入计算科学来解释人的认知行为;二是引用计算科学表征思维;认知是一个抽象的过程,主要包括了人类对概念的理解、逻辑的推理和自我解释的能力,西蒙引用计算科学对认知进行表征,就是一个将抽象的认知过程表征为可以客观而具象描述的过程;三是建立人类认知的科学;西蒙认为,完整的符号操作系统具有六种功能:1.输入符号(输入)2.存储符号(储藏);3.建立符号结构;4.条件性迁移;5.复制符号(复制);6.输出符号(输出);而人类的认知过程与符号操作系统可以一一对应,因此可以使用计算机模拟人的认知行为(见图一);四是将人视作符号系统;人类如何认知:人通过搜索解决问题,一般并不去寻找最优方法,而是寻找最满意方法,并能调整满意的程度。认知的过程即是对符号进行操作的过程。

 

三、符号主义AI的瓶颈问题

尽管符号主义AI取得了很多代表性的成果,但是符号主义的瓶颈问题一直困扰者AI的众多学者。在过去几十年里,大量的研究试图创建一个可以模拟人类大脑进行理性推理和数理逻辑运算的符号主义AI系统,但事实证明,人类许多问题采取的方案都无法进行符号表征。例如,人类可以凭借符号表征提取出猫的特征(如四肢、胡须、叫声等),但这一特征提取过程非常复杂,涉及到视觉、听觉等。但对于计算机来说,将这些特征转换为符号相当困难,需要从无限种可能中抽象出这些特征,需要处理大量的数据才可以提取这些相同的特征。例如,当一只猫完整地呈现在人和机器面前时,人和机器都能很容易地分辨出来这只猫;但是当一只猫的眼睛被暴露出来而身体的其他部位被遮挡住时,人可以凭借自己的“直觉”和“习得的经验”做出辨别的对象是一只猫的判断,而机器却很难拥有这样的“直觉”和“习得的经验”。简而言之,符号主义AI 不适合处理图像、音频、自然语言处理等非结构化数据。

哥德尔不完全性定理中的第一定理指出,任意一个包含一阶谓词逻辑与初等数论的形式系统,都存在一个命题,它在这个系统中既不能被证明为真,也不能被证明为否。同样的,符号主义AI也面临类似的问题,因为符号主义AI不能囊括所有的可能性。

另外,“常识”最明显的特征就是数据量过于庞大,从理论上来说,人类大脑的容量是无法估量的,且人类可以自主性地接纳自己需要的“常识”,但是机器缺乏这种自主性,倘若要机器处理海量的“常识”信息,在符号主义AI的纲领下几乎是无法实现的,毕竟,机器无法对所有的“常识”进行符号表征。

符号主义AI的另一个瓶颈问题就是缺乏泛化的能力,即缺乏动态表征的能力,我们称之为“框架问题”。二十世纪六七十年代拉斐尔(BertranmRaphael)、尼尔森(Nilsson)团队研发的机器人沙基(Shakey) [5] 便是“框架问题”的真实写照:机器人沙基被认为是第一台能够进行行动推算的可移动机器人,它配置的摄像头和传感器使得它可以在复杂的环境中完成对周围环境的感知,并在没有人工干预的情况下完成一些简单的操作。这是第一次将逻辑推理与机器的自身行动相结合的成功尝试。事实上,沙基这样的系统完成了内部世界的静态表征,即能够对特定的特征进行符号表征。然而,如果外部环境处于一直变化的状态,沙基的内部系统就必须对当前外部环境的特征进行动态表征,这就需要耗费大量的计算时间,显然,机器人沙基并不具备这样的动态表征能力。

 

四、符号主义AI未来发展的方向

针对符号主义AI的“常识”问题,科学家提出了将行为主义、联结主义和符号主义三者贯通,最终实现机器通过模拟人类的思考方式,自身可以进行合理思考。例如,联结主义与符号主义的结合,便可以解释深度学习的学习机制,并且完成海量“常识”信息的学习。(深度学习通过模拟人类大脑的学习方式,因此学习效果突出,但是深度学习的学习效果为什么好,就像是一个黑箱子,无法给出合理的解释,即缺乏可解释性)。三种流派都有自身的局限性,但是倘若可以将各自的优势都结合起来,或许可以使得人工智能的发展方向更加清晰明了。

事实上,为了解决框架问题,符号人工智能的研究者们已经提出两种相关的解决方案,豪格兰德(John Haugeland)分别称之为“廉价测试”(cheap test)和“省事策略”(sleeping dog)。 [6] “廉价测试”方法要求人工智能系统能快速检索每个事物,以便区别出行动会引起的相关项与非相关项。“廉价测试”的实现方法的设想就是将人类的“常识”进行公理化,即将常识都变成普遍接受的公理,再将这些公理用物理形式表征出来,机器可以通过学习公理进行正确的决策,实现逻辑自洽(实质上就是对知识进行全局化处理,再进行符号表征)。防止框架公理激增的另一种方案被称为“省事策略”,这种方案运作的机理依赖于常识惯性定律的形而上学原则(The Metaphysics of Common Sense Inertia),它预设了世界具有巨大的惯性,除非有一些积极的理由(情境中所施加的行动确定会引起变化的事物),否则假定其他事物和关系都保持不变 [7] 。“省事策略”的想法并不是试图把所有“常识”进行表征,而是对部分“常识”进行公理化,机器通过逻辑推理试图理解未表征的“常识”。尽管这种策略看起来比“廉价测试”更节约资源成本,但是机器的泛化能力如何实现还有待商榷。不过两种机制为机器学习“常识”问题提供了解决思路。

 

五、机器学习的弊端分析

不难发现,机器学习与符号主义一样,面临着缺乏泛化能力的瓶颈。与符号主义又不同的,符号主义所缺乏的是跨类别的泛化能力,而对于机器学习而言,缺乏泛化能力这个问题是致命性的。目前几乎所有的机器学习系统都是被训练于执行单一任务,而如果要实现通用智能(AGI),那么机器学习系统必须能够被用于执行多种不同的任务。虽然借助于表示学习(representation learning)和迁移学习(transfer learning),现在可以将模型的一部分应用于新的任务,但是针对新的任务进行重新训练(fine-tune)的模型在旧的任务上还是会有显著的性能下降——这意味着单一模型是不能够在完成当前训练任务的同时,仍然完好地保留对上一个任务的记忆的。是因为机器学习有一个很严重的现象,就是自我偏差,这种偏差可以体现在统计学的一个重要概念中,就是我们获得的数据也许是一个有偏数据,我们可能建了一个模型,对大部分的数据都有用,但其中有一些特例。面对这些特例,机器学习的处理方式往往是带有“自我欺骗”性质的,只会得到一种模糊的结果。例如分类模型,在遇到特例的时候,就会将其归类为决策面上的样本。尽管现存的各种机器学习的模型的优化已经完成得尽善尽美,但是涉及到场景迁移的内容,机器学习往往表现得力不从心。

另一个不得不提的瓶颈就是机器学习等算法模型缺乏“自主性学习”。我们知道,符号主义的人工智能虽然缺乏一定程度的泛化能力,但具有“自主性学习”的知识迁移能力。尽管迁移学习给机器学习、强化学习带来了将模型应用到大量数据的能力,但依然缺乏自主认知的能力。换个说法,也就是符号主义拥有主动认知的能力,而机器学习等算法模型只能被动地产生非真正意义上的“认识”。机器学习、强化学习所能做的,只是利用高质量的大数据实现某些特定的场景下的功能罢了。我们所处的世界中,机器学习的应用有上千种。机器学习正变得无处不在,这意味着,尽管我们仍持续强烈关注机器学习在准确性方面的表现,但我们的意图在于使得它们的准确率进一步提高。因为当我们在现实世界中使用机器学习时,它带来了一系列的新挑战。我把这看作是围绕着机器学习工作核心问题的隐蔽性问题。由于数据集的偏见,预测结果中就会有隐藏的偏见,比如公平问题,可解释性问题,因果关系的问题,如果我们真的想对结果的偏见进行干预的话,就必须采取更多的措施。如今机器学习成功的很重要的一个因素在于对数据集进行了适量的缩放,缩放数据集的大小,缩放学习算法的大小,缩放参数数量方面的模型,但在大规模的数据集上仍旧不存在突破,这也是它的主要弊端之一。

还有一点便是机器学习对数据的依赖性太强。我们知道,数据是机器学习的核心。当我们试图让机器学习扩展到越来越多的领域,收集数据、收集可用的数据,然后利用机器学习进行研究成果的推广,确实会给社会带来巨大的潜在好处。但是很多数据非常敏感,非常个人化,比如医疗数据,就是一个很好的例子。所以从隐私和安全的角度来看数据,这其中便是掣肘机器学习进一步发展的因素。我们知道机器学习不仅受益于更多的数据,而且受益于不同的数据。有时,你可以将多个数据集放在一起,你得到的不仅仅是数据之和。但问题在于,不同的组织,不同的人,如何把他们的数据放在一起,汇集这些数据来进行机器学习,而不是简单地让其他人或其他组织直接访问这些数据。机密的机器学习提供了这种可能性,数据可以整合,但只能在芯片上解密。它在芯片中被用来训练一个机器学习模型,然后这个机器学习模型或者它的预测结果被提供给数据提供者。由于它是在汇集的数据上训练的,所以它更有效,更有能力,但在任何阶段,任何实体都不能访问其他实体的数据。

 

六、如何让认知深入机器学习方法

人类通过不断的自主学习,当大脑的认知能力达到一定程度的时候,便可举一反三,可以对信息进行不同维度的转化,转化结果又能够应用到其他维度,从而产生新信息和新观点,也就是我们的大脑能够通过认知进行知识的再创造。那当机器具备一定程度的认知智能时,能对已有的信息进行再创造吗?目前我们可以确定地说“能”。认知系统在训练的过程中模拟人的思维,通过持续学习,获得不断增强的智能性,逐步接近人类所具备的认知能力。然而机器的信息再创造是创造出已存在的信息,是一个客观存在的知识,是确定性的。我们只能说,机器学习的成果可以作为人类认知的延伸,而不是人类认知的再创造。目前,研究认知计算与机器学习的领域也做出了颇多的成果,例如自然语言处理、计算机视觉、图像检测与预测等。尽管 AI 和机器学习的发展跌宕起伏,但深度学习和认知计算等新方法仍大大提高了这些学科的标准。有意识的机器可能仍无法实现,但帮助改善人类生活的系统目前已存在。

 

七、总结与展望

尽管符号主义和机器学习都不能完美的诠释人类认知的架构方式,但是符号主义与机器学习的结合AI未来可能的发展方向为实现机器进行自主思考提供了新的思路,只不过这其中,还有很长的路要走。未来的发展方向应该是人机结合,为机器赋予“认知”的“灵魂”,不可否认的是,人类的认识能力在机器的帮助下得到了很大的提升,因此,模拟人类智能的路还有很长,未来人机结合的发展依旧拥有无限可能。