
6月12日,第八届智源大会开幕式举行“重构世界:中国大模型巅峰对话”。本场对话由智源研究院院长王仲远博士主持,嘉宾包括小米集团MiMo大模型负责人罗福莉,清华大学计算机系教授、生数科技创始人朱军,面壁智能联合创始人兼首席科学家、清华大学计算机系教授、面壁智能创始人刘知远,以及南洋理工大学校长讲习教授、人工智能交叉研究院院长安波。
当下,人工智能正处在新的历史临界点。大模型不再只是提升效率的工具,而正在成为重构数字世界与物理世界的底层力量。AI Coding、自主智能体、模型自进化正在打开“AI创造AI”的可能;世界模型、具身智能和机器人则让智能从文本、代码和屏幕走向现实空间。正是在这样的时代背景下,智源大会将本场圆桌命名为“重构世界”:当智能成为生产力、组织力和创造力,人类需要重新理解技术边界、产业结构与未来想象力。
编辑:宇轩 梦佳
Scaling仍未停止:AI Coding正在逼近新的临界点
对话从最新模型 Claude Fable5 及其 AI Coding 能力展开。王仲远博士提到,Anthropic 近期发布的 Claude Fable5 在编程等能力上再次跃升。根据相关案例,一个约5000万行代码的代码库迁移,如果由人类团队完成大约需要一个月,而使用 Fable5 可在一天内完成。

罗福莉认为,Fable5 的出现并不是偶然的单点突破,而是大模型继续沿 Scaling 路径自然演进的阶段性结果。她将其能力来源概括为三个方向:第一,在预训练参数规模上继续扩大;第二,在 test-time scaling 和强化学习上投入更多计算;第三,模型训练数据从自然互联网文本,进一步扩展到人类与智能体共同产生的合成数据。她判断,参数、数据、强化学习与测试时计算这几条路径都还没有停止,因此 Fable5 仍是一个“中间模型”。
对于模型能力究竟是线性增长还是指数式增长,罗福莉表示很难用单一曲线刻画。大模型能力往往呈现涌现特征,在不同 Scaling 路径上都可能出现非线性变化,因此简单用固定曲线判断未来增长并不准确。
朱军则从视频模型和世界模型的经验出发指出,模型尺寸、数据质量和大规模训练仍在显著推动能力提升。以视频生成和物理世界模拟为例,两年多前模型还容易出现明显幻觉,而今天已经可以生成非常专业的内容,在部分场景达到影视级标准。他认为,无论语言模型还是视频模型,背后都体现出同一条路径:通过更精细的模型设计、更高质量的数据和更大规模训练,持续推高智能上限。
刘知远从数据闭环角度提出,AI Coding 的快速进展尤其具有启发意义。代码完全发生在数字世界,反馈清晰、验证直接,因此更容易形成持续的数据飞轮。Anthropic 之所以能在代码方向取得显著进展,一个重要原因就在于能够从全球范围内获得用户使用代码模型的反馈数据,并反过来促进模型持续提升。
他进一步指出,代码是数字世界的重要生产力工具。代码大模型能力的提升不仅会改变软件开发本身,还可能对工业软件、漏洞发现等领域产生颠覆性影响。中国在部分工业软件领域长期面临“卡脖子”问题,未来是否可能借助代码大模型重写一套新的工业软件生态,是值得深入探索的方向。
数据飞轮的启示:每个专业领域都可能孕育新机会
在刘知远看来,AI Coding 的意义不止于软件工程。更重要的是,它展示了一种专业领域快速形成数据闭环的可能性。任何一个行业,如果能在专业场景中建立可验证、可反馈、可持续积累的数据闭环,就可能加速 AI 在该领域的应用和演进。
安波也强调,智能系统的进展离不开外部反馈。无论是 Codex 还是 Claude Code,都不是在封闭环境中凭空变强,而是在大量真实使用数据和反馈中持续提升。对于推理任务而言,凡是能够转化为代码求解的问题,强大的 coding 能力都会显著提高系统表现;但并非所有问题都能通过写代码解决,未来还需要寻找其他路径和机制。
这一判断也指向一个更深层的问题:AI 的下一轮增长,不只是更大的模型和更多算力,还包括能否在不同产业中找到类似代码世界的数据闭环。谁能更早构建这样的闭环,谁就可能在垂直智能应用中取得领先。
智能体走向产业:核心在上下文工程与动态编排
随着基座模型能力提升,智能体成为近年最受关注的方向之一。安波认为,智能体目前仍处于早期阶段。今天很多智能体还停留在通用演示层面,真正的潜力在于落到工业界和垂直领域,解决人们特别在意的高价值问题,例如医学、科研和复杂产业系统中的难题。
他指出,智能体系统的关键不只是底座模型,还包括 Agent Harness,也就是围绕模型构建的一整套任务承载与执行机制。在底座模型给定的情况下,如何通过更好的 Harness 提升推理与执行能力,是他近期重点关注的问题。
安波特别提到,上下文工程是当前智能体中最核心的技术问题之一,包括 memory、任务编排、复杂流程控制、多智能体通信等。未来智能体需要在求解问题的过程中动态编排任务,并行处理多个子问题,同时根据上下文变化调整策略。只有具备这些系统能力,智能体才能从“能演示”走向“能可靠解决真实问题”。
AI自进化:从执行任务走向参与科研流程
模型自进化是本场对话的另一个重点。罗福莉表示,去年顶尖模型的能力上限主要体现在“执行”上:当人类给出清晰指令时,模型能够完成得非常好。但到今天,顶尖模型已经从执行层面向更抽象的问题求解外延。
她以完整科研流程为例进行说明:科研通常包括提出假设、设计实验、执行实验、设置合理观测指标、验证实验结果,并与同行交流以推动新的假设和想法。当前大模型已经不只是能执行实验任务,还逐步具备设计验证指标、规划实验流程、检查执行结果准确性的能力。
不过,她也指出,顶尖模型与顶尖研究员之间仍存在差距。这种差距主要体现在能否提出值得研究的问题、能否形成高质量研究判断,以及能否根据早期结果及时停止没有意义的研究。她认为,更强模型叠加更好的 Recursive Self-Improvement Agent 系统,正在逐步逼近这些能力边界。
刘知远则从科技革命角度理解“AI创造AI”。他认为,如果说工业革命的核心是用机器替代人类重复体力劳动,那么智能革命的核心就是用 AI 替代人类重复脑力劳动。工业革命发展到高级阶段,出现了“机器制造机器”;智能革命发展到高级阶段,“AI制造AI”也将是必然趋势。
他同时强调,所谓递归式自进化的最外层仍然应当是人。人需要决定要制造什么样的 AI,AI 应该服务什么样的社会目标。即便未来 AI 可以参与模型训练、数据生成、实验设计和系统优化,人作为社会主体的主体性和能动性,仍然是“AI制造AI”最核心的驱动。
安波也认可 AI improve AI 的方向,但提醒不能把“自进化”理解为完全封闭系统中的自动循环。在 AI 能力还不够强时,封闭环境里的数据飞轮未必能够真正运转。真实用户反馈、外部数据和人类参与仍然非常关键。至于更进一步的“自我意识”问题,他认为当前还没有到那个阶段。

世界模型:通向物理世界的另一条主线
如果说语言模型正在重构数字世界,那么世界模型则被视为进入物理世界的重要路径。朱军长期关注视频原生模型和通用世界模型。他认为,面向物理世界的智能系统需要具备三类能力:看懂和理解当前状态,预测和想象未来变化,并能够基于理解和预测进行规划与行动。
在数据层面,朱军指出,视频是目前最接近真实世界的大规模数据形态。电影、短视频、真实场景记录中包含大量物理世界信息,视频模型正是在尝试学习这些信息。随着模型架构和训练方法持续优化,视频模型正在从内容生成走向更广义的世界建模。
他强调,未来的世界模型一定不是狭义的视频生成模型,而应当是具备泛化能力、演进能力和行动支撑能力的通用世界模型,类似语言模型从 Transformer 走向 GPT 的过程。今天世界模型仍处在相对早期阶段,Scaling 复杂性比语言模型更高,但未来空间非常大。
罗福莉也认为,语言模型和世界模型正在并驾齐驱。当前语言模型走得更快,是因为数字世界的数据和反馈机制更成熟,模型可以在相对清晰的环境中通过 Agent 系统进行探索和自进化。世界模型要取得类似突破,需要首先构建高效的世界模拟器,再在其上叠加能够处理复杂现实任务的 Agent 系统,并探索如何在这些系统上进行强化学习的 Scaling。
朱军补充说,世界模型的效率问题也需要重新理解。对人类观看而言,视频生成需要渲染大量像素,因此 token 数量巨大;但对机器完成任务而言,未必需要把所有像素都渲染出来。模型可以在内部表征中进行思考和规划,最终直接输出动作。这意味着世界模型未来在效率优化上仍有很大空间。
重构世界的两条路径:数字世界先行,物理世界接力
围绕“重构世界”的路径,嘉宾们形成了一个相对清晰的判断:语言模型将率先重构数字世界,而世界模型和具身智能将进一步推动 AI 进入物理世界。
罗福莉认为,语言模型目前在数字世界中已经形成较清晰的路径:基模能力提升后,可以驱动更高层级的 Agent 系统,并通过更精确的激励机制促进模型自进化。世界模型则需要在高效架构、真实世界系统和强化学习机制上继续突破。
朱军认为,语言模型为其他类型大模型提供了重要启发,尤其是验证了 Scaling Law 的有效性。紧随其后的是视频模型和世界模型。后两者与物理世界关系更密切,能够帮助 AI 从“理解文本”走向“理解世界”。他判断,世界模型虽然更复杂、更早期,但一旦通用基座形成,将为物理智能、机器人和具身智能提供关键基础。
刘知远则强调,无论在数字世界还是物理世界,核心都是找到能够持续演进的数据与反馈机制。AI Coding 的经验说明,闭环越清晰,能力提升越快;未来其他行业也需要找到各自的数据闭环,才能真正释放大模型能力。
安波则从应用角度指出,智能体和自进化最终都要落到真实问题中。如果没有真实场景、真实反馈和真实目标,系统很难持续变强。未来的关键不是停留在概念层面,而是让智能系统进入产业深处,解决复杂而重要的问题。

面向年轻人:保持好奇心,拥抱AI,选择重要问题
在对话最后,嘉宾们也回应了年轻人在 AI 快速发展时代中的焦虑。
罗福莉认为,大模型和智能体进步速度极快,但人的探索欲和好奇心仍然是不变的优势。她建议年轻人保持强烈的好奇心,更极致地使用最新 AI 工具,在大量试错中培养自己的判断力、审美和研究品味。
朱军结合清华无穹书院 AI 本科生培养经验表示,技术快速变化对所有从业者都是挑战。年轻人需要打造 AI Native 的成长环境,从一开始就积极使用 AI,与 AI 共同学习、共同突破。同时,越是在变化剧烈的时代,越要打牢根基,形成长期竞争力。
刘知远给青年学生提出三点建议。第一是敢为人先。真正的大创新往往是反共识的,需要在别人还没有看到时率先行动。第二是能够坚持。做不一样的选择,必然会遭遇质疑和否定,能否坚持下来非常关键。第三是不要成为既得利益者。即使取得阶段性成绩,也要敢于自我否定,继续面向未来作出新的探索。
安波则提醒年轻人选择真正重要的方向。他认为,学位在这个时代的重要性正在下降,真正重要的是会什么、能做什么、是否处在前沿问题之中。如果年轻人能进入一线 frontier lab 做真正前沿的研究,几年高强度实践可能比按部就班取得学位更有价值。他还强调,在变化极快的时代,年轻人需要找到志同道合的小团队,共同学习、快速交流,而不是长期独自卡在某个问题上。
这场“重构世界”的巅峰对话表明,大模型正在从单点能力竞赛进入系统性演进阶段。AI Coding 展示了数字世界的数据闭环,智能体代表了模型能力的组织化释放,自进化指向“AI创造AI”的未来,而世界模型则打开了通往物理世界的大门。未来的关键竞争,不只是模型大小和榜单排名,而是谁能率先掌握创造智能、驾驭智能,并让智能真正重塑现实的能力。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢