上周,阿里安全有幸邀请到中国科学院院士、清华大学人工智能研究院名誉院长、中国人工智能奠基人张钹院士,莅临阿里巴巴北京新总部与阿里同学面对面交流。

89岁的张钹院士亲自制作了30多页PPT,与阿里同学分享《生成式时代的人工智能产业》,本文为现场分享实录,经张院士亲自校对💗



信息产业能够迅速而持续地发展,主要得益于两条截然不同的道路。一方面,信息科技持续推进,不断与传统产业实现更深入和高效的融合。现代的计算技术自1936年诞生以来,经历了显著的发展,特别是1948年,通信理论与控制理论的建立,为信息产业的飞速成长提供了坚实的理论支撑。

得到这些理论支持的信息技术,不断突破,产生了广泛适用于各种场合的硬件和软件。这不仅彰显了技术的通用性,也预示着市场拥有巨大的潜力。随着信息技术的广泛普及,无论是个体还是企业,比如微软、英特尔这样的大公司,都能够迅速从计算机的硬件和软件进步中受益,享受技术进步带来的便利,而不需要任何复杂的机制或工具。

信息产业的所有硬件和软件全是通用,市场非常之大。而人工智能都是跟领域紧密结合,只有算法和模型,而且这些算法和模型都是领域限定,任务限制的,开发出来的所有人工智能的硬件和软件全是专用,跟信息产业完全不同。


为何人工智能的发展会呈现当前的格局?首先,我们需要理解,第一代人工智能聚焦于知识驱动模型,这类模型依赖知识和算法策略来实现功能。相比之下,第二代人工智能则是数据驱动模型,主要依靠庞大的数据集和数据处理算法。

无论是哪一代人工智能,我们的工作都受到三个主要限制的影响:只能在特定领域内应用特定模型完成特定任务,这种局限性造成了所谓的弱人工智能——它虽然在特定领域内表现出色,但缺乏广泛的适用性。

受这三重限制的束缚,企业必须深度结合不同垂直领域,才能确保人工智能技术的有效商业化;若无法与特定应用领域紧密结合,则人工智能产业的形成难以成立。因此,与应用领域的紧密结合成为了人工智能的显著特点之一。

再来考虑未来人工智能产业的发展与增长。据统计数据表明,人工智能产业已经见证了部分重量级企业的崛起。按照美国的统计数据显示,2020年估值达到10亿美元的人工智能企业大约有40家;仅两年后的2022年,这一数字迅速增长至117家,而到今年3月份,更是增至126家。

为了深入理解这些企业的增长路径,我们需要观察他们如何应用人工智能技术。目前观察到,企业内部决策和市场营销领域是人工智能应用最广泛的两个区域。在交通运输方面,也明显看出AI的应用能力不断增强。金融、教育和医疗等领域也在紧随其后。

交通领域的发展可谓惊人,当前其估值高达85亿美元,其中的代表性企业如小马智行以及中国兴起的其他一些智能交通系统证明了该领域的巨大潜力。这些企业之所以能获得显著扩张,一个重要原因在于它们采取了面向消费者的模式(to C)。考虑到每个人都需要出行方式,这些企业能直接服务于终端消费者,满足他们的日常需求。即便是在传统的制造业领域,如果企业不能为每个家庭提供实实在在的便利和福祉,其扩张也将十分有限。

在金融领域,智能决策系统正被用来简化和加速贷款流程,这也显示了人工智能在该领域的实用性和可扩展性。当前许多人工智能公司正积极追求向企业提供服务的模式(to B),但在我的观点看来,如果企业仅依赖单一的客户或项目,没有提供一系列综合性的产品或服务,很难实现长远和实质性的成长。

另一个成功的路径是拓展应用领域。以美国医疗公司为例,它们通过运用数据驱动模型,成功地提供个性化和精准的医疗服务,这些服务不只局限于特定疾病,而是涵盖了肿瘤、神经疾病、心脏病、传染病和放射性疾病等多个治疗领域。因此,尽管单一的医学图像识别技术有其价值,但企业要想达到规模化成长,必须跨越单一专业领域的界限,将服务扩展至更广泛的治疗范围。因为只有能够处理和诊断多种病症,企业才有可能实现大规模的增长。

例如,DataBricks公司的估值达到了380亿美元,可以说是目前人工智能行业中估值最大的公司之一。它之所以能发展到如此规模,是因为它构建了一个广泛适用的平台,这类平台依赖于海量的数据资源和数据驱动模型,只要能成功构建这样一个通用平台,就为公司进一步的增长和扩张创造了前提条件。

大语言模型的关键成就之一就是强大的语言生成能力。开领域的模型能够生成多样性和语义上连贯令人惊讶的、类似人类的文本,例如ChatGPT。我们在大模型构建过程中设定了多样性的结果,实际上正是这个多样性激发了创新性发展。创新在多元化环境下才能蓬勃发展,因此我们应鼓励创新,但多样性不可避免地会产生错误。故监管机构和政府部门应支持实践探索而非完全禁止犯错,犯错是创新不可或缺的一部分,关键在于妥善管理,避免严重后果。

ChatGPT之所以达到当前的质量水平,是因为人工智能经过几十年的努力,实现了三个关键技术突破:
- 基于词嵌入的文本语义表示。
- 基于注意机制的转换器。
- 基于预测下一个词的自监督学习。

这三个关键技术突破,使得机器处理文本的方式发生了本质上的变化。不再是将文本仅视为数据处理的对象,而是作为知识来对待。因此,ChatGPT的成功应归功于知识、数据、算法和算力这四个要素的结合,还需强调四要素共同作用的重要性。


实际上,人工智能领域面临着许多严峻的挑战。由于机器的运作主要由外部因素驱动,通过概率预测方法进行操作,这不可避免地引入了人类未涉及的不可控元素,如输出质量的不一致性,尤其是在输出中无法保障准确性,同时对外界“提示”的敏感性也较高。而人类工作的方式与之大相径庭,所有活动均在内部意识的主导下进行,并且个体对自己的行为有清晰的认知。相比之下,机器并不具备自我意识,不知晓它在处理何种信息。

因此,我们可以得出,在人的内部意识控制之下,因此结果是可控的,而对于机器则刚好相反,其操作是在概率预测的情况下进行。这暴露出人工智能在执行任务时与人类的本质区别,也突显出我们在应用开发过程中必须面对和解决的关键问题。

此外,我们还观察到,并非所有问题都适合于通过生成式方法来解决。如果要求的输出是确定性的,并不适合于使用生成式的方法解决。例如,对于孔子逝世时间的询问,模型有时可能提供正确答案,有时又会出错,这是由于模型没有将这一确切的时间信息进行准确储存。因此,我们不能单纯认为生成式方法能够解决所有问题。


例如,当我向ChatGPT询问清华大学校歌的歌词时,它给出了一个它自己编造的版本。这种情况我一年多前就遇到过,直到现在还是如此。我指出它的错误,告诉它清华大学校歌的真实歌词是“西山苍苍,东海茫茫,...”,即使我将正确的歌词告诉了它并得到了它的道歉,当我退出并再次提问时,它又重复了同样的错误,编造了另一套歌词。这说明了它并不知道自己犯了错误,即便在被指出错误之后,也无法自行改正。

正因为此,尽管有人认为机器最终会不断进化并有可能超越人类,这种想法并不切实际。原因在于,机器无法自我验证行为的正确性,它们的发展和学习过程仍旧依赖于人类的引导和辅助。所有机器的活动都是在人类的推动之下展开的,因此在目前工作的模式下机器超越人类的设想并不可能实现。

另外一个需要考虑的问题是输出的质量不一致。举例来说,我输入一个句子时,大模型在输出的六张图像中,有3张则与输入提示词毫无关联。因此,对于人工智能的治理问题,我始终认为发展是最根本的理念,治理应当促进发展,若治理措施阻碍了发展,则该治理是不合理的。对中国而言,发展尤为关键。因此,在讨论发展实力时,我们的关注点不仅是在人工智能领域有无话语权,更重要的是建立自身的实力。实力是获得发言权的关键,我们希望的话语权不仅限于人工智能领域内部,而应通过不断增强实力来赢得。

在治理领域,我们面临的关键问题不仅仅是关于被治理的主体,更重要的是如何实施有效的治理措施。在此过程中,我们必须要处理几个关键的事项:

大语言模型只解决语言生成问题,我们应当在信息(数字)世界和物理世界中积极开展工作。对于物理世界的各项任务,需要实际动手操作,这就要求我们使用机器人等工具,这是实现具身智能的基础。过去,智能的发展主要集中在具备“脑力”的智能上,但这是不足够的,我们必须将之与具有物理形态的智能结合起来,这样的综合体才能真正解决物理世界的问题。物理世界的交互能力也包括与人类的互动,因为人类自身也是物理世界的一部分。

因此,我们在设计和制造机器人时,不应仅仅局限于人形机器人。考虑到工厂环境下的劳动需求,很多工作可能并不需要使用脚,有时仅需双手即可完成。埃隆·马斯克开发家庭服务机器人的目的很明确——适应美国家庭可能存在的上下楼梯的需求。然而,在中国,这种需求量可能没有那么大。因此,我们应基于中国的实际国情进行考虑,例如国内某些大学进行开发类似变形金刚的高效率机器人的研究,应当给予足够的重视,并不应仅局限于开发人形机器人。


具身智能为机器人带来了能够与环境结合、进行自反思的优势,而反思能力意味着改正错误的可能性。这正体现在强化学习理论之中,该理论认为只有通过连续的实践和反馈迭代,计算机才能识别出正确的行动,进而实现不断的演化和改进。在此之前,我们无法直接判断某一行为的对错,只能通过实践经验来获取知晓。

人工智能在各个领域的影响力是深远的。以高盛全球投资研究做出的分析为例,受影响较小的行业大多为蓝领工作。与之不同的是,白领工作则显示出受到较为明显的人工智能影响。同时,如行政工作,有被人工智能完全替代的风险。

根据任务的性质,人工智能的应用大体上可以分为三种模式:第一种是用于辅助提升工作的质量和效率;第二种模式关联到监督监管层面,在像设计工作这类领域,人工智能可以提供多个方案供选择,但最终的决策仍需人来进行,这反映出对人工智能系统的信任尚未达到完全放心的程度;只有极少数的任务可以完全交由人工智能独立完成,并获得全面的信任。


我们的团队提出了第三代人工智能的概念,并强调了建立人工智能理论基础的重要性。目前,人工智能领域尚未有一个坚实且广泛认可的理论基础,这种状况引发了许多误解和困惑。只有当我们真正掌握了人工智能的理论,才能构建出一个安全、可控、可信、可靠以及可扩展的人工智能技术体系;在缺乏完备的理论基础条件下,人工智能技术的安全性始终是一个不容忽视的问题。

要达到这个目标,我们特别强调了知识、数据、算法和算力这四个要素综合运用的重要性。例如,ChatGPT的成功就是得益于这四个要素的有机结合。尽管ChatGPT使用的是文本格式,但它实际上是学习了文本中蕴含的知识。关于这点,我们的做法与外国的研究方法有一定的差异,外国研究者将人工智能的发展分为三个阶段,称为“Wave”,而我们谈论的则是三个“Generation”。

同时,外国的研究者非常强调数据和算力的重要性。例如,OpenAI在展示其人工智能技术时,给很多人带来了忧虑。他们展示的能力是建立在大量数据的基础上的,而不是空穴来风的预测。

因此,我们在竞争中特别强调“知识、数据、算法、算力”这四个要素的重要性。在这场竞争中,我们不能仅仅依赖于实力的角逐,更应依赖于智力,这主要指的是知识和算法。对方虽展示了强大的数据和计算力,我们当然也拥有数据资源,但我们更应该注重知识与算法这两方面,它们才是智慧的真正体现。

以我们团队的工作为例,我们致力于使用更小的模型解决相同的问题,以此展示我们依靠智慧而非单纯算力的能力。我们的模型性能已经做得非常出色。目前看来,我们的发展策略是朝向减小模型规模的方向发展。

模型规模的减小,意味着我们能够将这些模型应用在移动端设备上,如智能手机中,执行计算和处理任务。大家也见证了性能的提升使得模型趋向性能更好的红色区域。

因此,我们仍然可以找到解决方案:在算法上投入更多的精力,提升算法的效率,这将减少对模型规模的依赖。因此,我们在此特别强调,必须把知识放在数据之前。只有当我们充分了解和掌握了知识,才能够与其他竞争者一争高下。毕竟,我们拥有雄厚的师资力量。虽然在实力方面我们可能不敌对手,但在智力上,我们并不逊色。


在本次交流会上,张钹院士以其横跨四十余年的人工智能探索经验给予宝贵的指引:人工智能的发展之路犹如不断开拓的“无人区”,它的旅程永远在脚下。面对这一充满机遇与挑战的领域,最关键的是要坚持不懈地努力,不断探究,勇往直前。

在人工智能议题持续占据热点的今天,张院士的见解唤起了我们对这一领域更加理性、深入的思考。他强调,要真正推动该领域向前发展,中国学界需更专注于人工智能的基础理论研究,并集结各路英才拉近协作的纽带。因为只有强大的理论支持和人才汇集,才能在激烈的全球竞争中占据先机,稳立潮头💪



📺直播预告


📌往期推荐




👇AAIG课代表,获取最新动态就找她

 关注公众号发现更多干货❤️



内容中包含的图片若涉及版权问题,请及时与我们联系删除