
当前的人工智能领域正通过生成式人工智能(GenAI)经历一场重大转变。这一转变不仅代表了技术上的飞跃,更标志着人工智能领域的范式转变,引发了有关GenAI的独特特性及其深远影响的关键问题讨论。
植根于计算革命的丰富历史,本文从计算复杂性角度出发,探索推理和知识的本质,将历史性成就与最新的进展巧妙地交织在一起,以丰富我们对人工智能的理解。
(本文作者为吕坚平博士。以下内容经授权后由OneFlow编译发布,转载请联系授权。原文:https://cplu.medium.com/reasoning-and-knowledge-80a02ec6c75b)
作者 | 吕坚平
OneFlow编译
翻译|宛子琳、杨婷
1
引言:计算革命的回响
回顾20世纪50年代艾伦·图灵的实用方法,即通过实践看看效果如何(let’s do it and see how it works)体现的哲学思想,GenAI的能力体现了这一精神。思维链(Chain-of-Thought(CoT))提示工程(prompting)(Wei, 2022)和检索增强生成(Retrieval-Augmented Generation(RAG))(Lewis, 2020)等技术展示了如何让人工智能模拟人类推理和知识吸收方式,其重点是人机协同验证。思维链使人工智能能够在解决问题时“深思熟虑”,而RAG使得人工智能能够访问大量数据源以丰富其回应。
相比之下,哥德尔对AGI的看法更为审慎、明智,他重点关注人类思维相比机器的优越性,在两者之间提供了一种必要的平衡。这种观点强调了在AI开发中采用理论上坚实和稳健的方法的重要性。有趣的是,当前人工智能领域取得的进展,如新的训练方法和对齐策略,在某种程度上与哥德尔的原则是相呼应的。
GenAI的演进还表现为使其能够自我参照和自我改进的先进技术,这些技术借鉴了哥德尔的数学洞察力和图灵的计算理论。像Auto-CoT(Zhang,2022)和Self-RAG(Asai, 2023)等创新就是GenAI利用其技术进行自我增强的例证。
尽管GenAI的表现令人印象深刻,但也面临着各种问题和挑战,这些挑战主要体现在扩展图灵遗产的经验主义方法上。从哥德尔的角度考虑这些挑战,可能会为我们提供宝贵的见解。这种情况呈现出一个明显的悖论:如果“P vs. NP问题”(计算复杂性领域尚未解决的基本问题)得到明确解决,可能会影响到哥德尔对人类思维优越性的看法。下文将详细探讨这一悖论及其对AGI的影响。
引言部分为深入探讨GenAI做了一定铺垫。本文的目标是剖析GenAI如何实现其卓越表现,并揭示其中固有的挑战。我们将专注于广泛的历史和方法论方面,这对GenAI的持续发展至关重要。
对于那些对计算的历史和理论基础感兴趣的人,推荐阅读“从不可能的机器到多功能计算机,再到AGI”部分。
对生成式人工智能的独特性以及它与计算机基础和图灵的经验主义方法的契合感到好奇的读者,应深入了解“生成式人工智能是计算的全面扩展”部分。
要从哥德尔的角度理解推理和知识,“从第一性原理重新审视推理和知识”是阅读的首选部分。
最后,“从P vs. NP到AGI”部分将为读者提供对以人为中心的AGI的前瞻性见解。
2
从不可能的机器到多功能计算机,再到AGI
要充分理解GenAI的革命性,就必须深入探索艾伦·图灵所设想的计算的基本问题。在图灵时代,由大卫·希尔伯特(David Hilbert)领导的数学形式主义学派提倡一种观念,即所有数学知识都可以从一组基础公理或第一性原理中通过逻辑推导得出。这一时代见证了逻辑推理从亚里士多德时代有意识的思维训练发展为一种机械符号操纵系统。这种方法根植于逻辑规则和数学公理的形式系统,表明数学家的聪明才智和固有的知识在数学中可能并非至关重要。这一思路还催生了通用证明机(universal proving machine)概念,该机器能够通过符号逻辑解决任何数学问题,而不依赖先前的数学知识——这是Entscheidungsproblem(判定问题)的核心概念。
从判定问题到停机问题
1931年,库尔特·哥德尔的第一不完备性定理从根本上改变了数学的面貌。该定理揭示了没有既能够“完备(包含其范围内的每一条真理)”,又能够“一致(即没有矛盾)”的形式系统。哥德尔后来阐明了其定理的深刻含义,他说:“思维在使用中不是静态的,而是不断发展的,也就是说,随着我们不断使用抽象术语,我们对它们的理解会变得越来越精确。”(Copland,2013)。这强调了人类的参与在数学第一原理的理解和扩展中起着至关重要的作用,突显了仅仅从这些基本概念进行逻辑推理是不够的。
在这一转变的范式中,图灵走上了通向“判定问题”(Entscheidungsproblem)的另一条路径,偏离了对通用“证明”机的探求,转而研究通用计算机的可能性。其动机在于,这样一台机器将会过于强大以至于无法存在。它将能够自我参照,这必然会导致悖论。
这一探索的最终成果是图灵对停机问题的构想:在不实际运行某个机器的情况下,一台假设的机器,他称之为‘停机预言机(Halting Oracle)’是否能够确定任何给定的机器在特定输入下是否最终会停机,还是会无限运行?图灵通过构思一个名为M的假设机器来应对这一挑战,该机器被设计为直接违背停机预言机的预测,如下图所示:

如果M在给定M作为输入时停机,根据其定义,它将无限循环:这是一个矛盾。 相反,如果M在输入M时无限循环,它应当停机:这是另一个矛盾。

现代计算的基础
通用计算机:图灵提出的一台能够模拟任何程序,甚至是停机预言的机器(M),它奠定了通用计算机的基础。这一创新清晰地区分了硬件和软件。 机器-程序二元性:停机预言将M同时视为硬件和软件的概念引入了机器-程序二元性。这种二元性意味着程序可以被视为其他程序的硬件,比如虚拟机和库,从而形成不同层次的抽象。 程序-数据二元性:图灵认识到M可以处理其他机器作为输入,这引发了程序-数据二元性的出现。这一原则指出,程序可以被其他程序视为数据,使得编译器和解释器等软件工具得以实现。这种二元性是现代软件架构的核心。
缺乏通用的证明机制,或是理论上可能使软件工程变得过时的停机预言机,却意外地推动了计算机革命,催生了多功能的计算机和如今我们所熟知的软件工程师所扮演的不可或缺的角色。 缺乏通用的证明机制或者停机预言机意外地推动了计算机革命,使得多功能计算机得以崛起,并塑造了软件工程师这一不可或缺的角色。
从人类直觉到通用人工智能

图灵的研究重新点燃了那个至关重要的问题:“机器能思考吗?” 现在则转变为“直觉能被机械化吗?”。这种转变标志着对于通用人工智能(AGI)讨论的深刻演变,暗示AGI可能不仅仅是计算革命的延续,而且可能是其巅峰。 关键问题,“机器能思考吗?” 转变为 “直觉能被机械化吗?” 哥德尔的观点丰富了这一概念,阐明了人类思维在概念化和扩展公理方面的能力。这种能力可以通过从集合A过渡到A'的过程来展示,如图表所示。这种过渡超越了机械化证明的范畴。他的这种见解强调了人类思维具有超越机械化直觉限制的独特能力。
3
生成式人工智能是计算的全面扩展
以语言大模型(LLM)为核心的生成式人工智能(GenAI)在通用意图的推理“硬件”方面开辟了一个充满潜力但也充满挑战的世界。这场革命的核心是一种被描述为“不知而行(doing without knowing)”或者“通过实践看看效果如何(let’s do it and see how it works)”的矛盾方法。这种方法表现为,GenAI依赖涌现能力而非明确编程的特征,使其在各个领域展现出卓越甚至“不合理”的效果。然而,支撑其适应性的这一特征也会导致算术错误等基本错误,以及所谓的“幻觉”现象。在这些情况下,GenAI自信地产生引人误解或不准确的信息,突显出对其自身知识限制的认识不足。GenAI内部的这种二重性——多功能以及容易出错的特征——令人着迷,引发了人们对其能力的热情,同时也需要谨慎对待。 我们对生成式人工智能(GenAI)的热情是矛盾的,因为它不仅毫不费力地展现出巨大的潜力,又预示了一个充满希望却又复杂的未来。它被认为是“不合理”的有效性,意味着GenAI体现出计算的本质特性,使其成为一股革命性的力量,类似于计算本身。 GenAI的有效性意味着它具有类似计算本身的本质特性。
LLM作为新硬件
自然语言接口:LLM擅长理解和生成人类语言,因此能够与其进行直观互动。这使得系统能够处理高级提示和响应,包括“智能体(agent)”,即促进用户和LLM之间交互的软件模块。这种动态过程对于GenAI的“机器程序二元性”至关重要。在这种架构的每个抽象层级中,系统呈现出外部智能体或用户所感知的人工智能,这与现代计算系统中的多层次架构相呼应。 指令遵循:由于机器-程序二元性,LLM被视为人工智能抽象层次结构中的基础元素,十分擅长处理自然语言指令。这类似于计算机中CPU的功能,将LLM定位为一种通用推理“硬件”。它能理解广泛的指令和任务,使其在认知和推理任务领域具有计算机硬件的多功能性。这一特性凸显了GenAI在各种应用中的功能,反映出通用计算机的适应性。 上下文学习/少样本学习:LLM的这一显著特点使其能够从有限的示例中学习和适应,甚至可以从自身的输出中学习。这表明了计算中固有的程序-数据二元性,即数据(在本例中是学习示例或生成的内容)可以被重新输入作为程序指令。这种在少数示例中持续学习和适应的能力反映了数据和程序可互换的动态性质,这是计算的一个关键特征。


生成式人工智能创新成为新的软件工程

解决AI的不可预测性或“密切监督AI”:这一模式专注于对AI系统的警惕监督和持续。它重点解决了语言大模型的不可预测性和潜在错误,这是推进GenAI的一个关键方面。 拓展AI的功能范围或“增强AI的自主性”:这一模式代表着在增强GenAI能力方面的重大转变,赋予AI系统自主管理各种复杂任务的能力。这一趋势的一个典型例子是假设文档嵌入(HyDE)方法(Gao, 2022),它利用AI生成的示例来引导相似性搜索。这展示了对AI生成特征的巧妙应用,特别是在战略性地利用其“幻觉”来增强密集检索系统性能方面。 拓展上下文感知或“开拓AI理解周围环境的能力“:这种模式以检索增强生成(RAG)(Lewis,2020)为代表,涉及整合外部的实时信息,以丰富人工智能对上下文的理解和响应。
密切监督AI(Let’s Watch AI’s Back):该模式侧重于通过聚类和有针对性的采样来识别和缓解AI推理中的错误,以确保密切监督和持续改进。 增强AI的自主性(Let AI Do More Work): Auto-CoT自动生成推理链,使得AI能够更自主地处理复杂的推理任务。 开拓AI理解周围环境的能力(Let’s Look Around for AI): 该模式通过存储和检索各种AI生成的推理链,为未来任务构建更丰富的上下文,增强人工智能的上下文适应能力。
GenAI迈向AGI的必由之路



GenAI的这些发展与图灵对机器和人类思维处理方式的愿景相一致。虽然GenAI主要关注可扩展性和商业应用,但其发展轨迹日益与追求AGI的目标相交汇。在经济需求和功能需求的推动下,GenAI的发展不仅推动了人工智能技术的进步,或许也在不经意间引导其朝着AGI方向发展。 GenAI的历程或许正在无意中引导其走向AGI的实现。
4
从第一性原理重新审视推理和知识
逻辑推理与合情推理
假设一名服务员收到一份包含浓缩咖啡和苏打水的订单。他问:“谁点了苏打水?”一旦他弄清楚是谁点的苏打水,那么对于他来说,知道谁点的浓缩咖啡就很容易了。
合情推理(Plausible Reasoning):最初,服务员的推理方式是合情推理,主要源自于工作经验或观察到的顾客行为。这种形式的推理涉及弱三段论(weak syllogism)和概率思维(probabilistic thinking),其中一般模式(A→B)和具体实例(A为真)推导出可能的结论(B可能为真)。这个概念与乔治·波利亚(George Pólya)(1945)和E.T.杰恩斯(E.T. Jaynes)(2003)关于“概率作为扩展逻辑”的概念一致,从而允许从可用信息中推导出的可能性得出结论。 逻辑推理:在确定谁点了苏打水之后,服务员转而采用演绎的逻辑推理。这一步骤涉及从一个普遍前提(A→B)和具体信息(C→A)到一个逻辑结论(C→B)的清晰三段论推理。
逻辑推理的第一性原理
E1:“顾客1点了浓缩咖啡” S1:“顾客1点了苏打水” E2:“顾客2点了浓缩咖啡” S2:“顾客2点了苏打水”
大前提:每位客人恰好点了一份饮料,并且每种饮料都有一位客人点单,XOR语句表示如下:
E1⊕S1(顾客1点了浓缩咖啡或苏打水,但不能两者都点) E2⊕S2(顾客2点了浓缩咖啡或苏打水,但不能两者都点)
小前提:顾客1点了苏打水(S1为真)。 结论:因此,顾客2点了浓缩咖啡(从S1推导出E2)。
(E1⊕S1)∧(E2⊕S2)(大前提) S1 (Minor Premise) S1(小前提) ∴E2 (Conclusion) ∴E2(结论)

快速验证;很难猜测
如何衡量一个好的猜测?
频率论者的观点:将概率视为事件的长期频率。虽然对于日常决策来说并不完全实用,就像我们的服务员所面临的那样,但它构成了概率论的基础方面。 贝叶斯观点:将概率视为个人信仰或知识的衡量标准,深受人类经验的影响。这种观点与我们在日常生活中解释概率的方式密切相关。 杰恩斯观点:由杰恩斯在2003年提出,该方法将贝叶斯框架扩展到包括人工智能和搜索算法等非人类实体。其中概率是适用于任何推理实体(无论是人类还是机器)的知识状态。
合情推理的第一性原则

知识广博的推理体面临的挑战
5
从P vs. NP 到 AGI
重新审视判定问题(Entscheidungsproblem)
如果存在停机预言机会如何?
如果P=NP会怎样?
与上述情况类似,假设出现了一种“圣杯”解决器,即一种可行的NP求解器——人工智能的定义经历了一场范式转变,与通用人工智能的传统轨迹大相径庭。这种转变,特别是在假设P等于NP的情况下,为AI能力引入了根本性变革。在这种情况下,推理和知识之间的边界变得模糊;传统上依赖于积累知识的推理可以在没有庞大信息数据库(目前是必不可少的)的情况下实现。
在这样一个假设情境中,传统上依赖于积累知识的推理可以在没有庞大信息数据库(目前是必不可少的)的情况下实现。
假设人工智能具备了一个能够解决任何问题的算法。在这种情况下,AI不再需要像以前那样通过学习演进、积累数据,或模仿人类思维等方式来解决问题。经过这一计算方面的突破,AI变成了一个全能的问题解决者,虽然在学习方面没有进展,但在解决问题方面却是无与伦比的。AI的作用也发生了巨大变化,不再仅仅是一个根据人类需求不断发展和适应的工具,成为了一个无所不能的解决者,重新定义了计算和问题解决的极限。问题的本质曾经需要依赖知识和经验,现在却变成了一个完全由算法探索的领域。在这个新时代,人类陷入了深刻的身份危机,开始质疑自己在一个智能和问题解决不再受知识积累限制的世界中的角色和目的。
在假设的“P=NP”时代,人类陷入了身份危机,开始质疑自己角色和目的。
6
结论
【语言大模型推理最高加速11倍】SiliconLLM是由硅基流动开发的高效、易用、可扩展的LLM推理加速引擎,旨在为用户提供开箱即用的推理加速能力,显著降低大模型部署成本,加速生成式AI产品落地。(技术合作、交流请添加微信:SiliconFlow01)
SiliconLLM的吞吐最高提升近4倍,时延最高降低近4倍
数据中心+PCIe:SiliconLLM的吞吐最高提升近5倍;消费卡场景:SiliconLLM的吞吐最高提升近3倍
System Prompt场景:SiliconLLM的吞吐最高提升11倍;MoE模型:推理 SiliconLLM的吞吐最高提升近10倍
试用OneDiff: github.com/siliconflow/onediff
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢