2026年6月12日下午,智源大会「青源InnoVibe 2026共创场」在中关村国际创新中心举办,18位青年学者依次登台,聚焦世界模型、具身智能、Agent、强化学习、AI for Science等前沿方向,以闪电演讲形式分享了前沿科研成果、创新项目构想与行业洞见,集中展现了属于新生代的学术锋芒与独特徽章。


近年来,人工智能领域对青年创新力量的需求日益迫切,青年学者们正在逐渐成为推动技术革新的新生力量。2026智源大会InnoVibe共创场特别活动专为青年学者而来,致力于为AI领域青年科学家构建一个集思想碰撞、技术交流、成果展示与合作机会于一体的多元化平台。

北京大学本科生、逆矩阵科技有限公司联合创始人陈博远指出,真实物理世界不能照搬语言模型的数据规模化路径。物理规律藏在物体的交互之中,而不是像素里。文本世界的规模化之所以有效,是因为它是全观测的,而物理世界部分可观测、交互稀疏长尾,因果和相关是完全不同的两件事。他认为,世界模型的正确方向不是生成以假乱真的视频,而是在隐空间理解物理的底层规律,由基座模型统一学习物理、不同解码器各自做应用适配。

中国人民大学博士生董冠霆指出,智能体强化学习的核心矛盾在于:如何在长程推理与多轮工具调用之间取得平衡。模型每多一次工具交互,其推理不确定性会迅速累积。为此,ARPO 的思路是在高不确定性的工具节点上引入自适应分支探索,从而更有针对性地加大对高价值步骤的探索力度。更进一步,他指出现实场景中的 Agent 训练环境往往是动态的:一次工具调用就可能改变环境状态。因此,通用智能体的训练不应停留在静态环境里训练,而应走向环境—智能体协同演化的持续学习范式。

复旦大学博士生窦士涵提出,过去模型的训练范式让AI主要利用静态的世界知识推理,而人类智能的核心是利用复杂动态的上下文推理。希望AI面对一个全新的文档时,读完就能干活。他用虚构国家法律、全新编程语言等场景测试了最强模型的上下文学习能力,结论是这条路还很长。同时他还提出未来应用AI的方式将发生根本转变,我们不再需要为垂直领域构造训练数据,只需提供该领域的上下文,模型就能通过强大的上下文能力和不断自身优化harness来更好管理、理解和利用上下文,实现适配任何新领域。

清华大学博士生何秉翔指出,可扩展强化学习存在三条边界。第一条是简单配方的边界:JustRL 证明最朴素的单阶段 GRPO 依然能充分 scale 到 1.5B 规模最优,说明许多被默认有效的技巧,其有效性其实依赖于配方本身的复杂度。第二条是无监督奖励的边界:内在奖励本质上是一个回声室,只能锐化模型已有的置信分布,而非创造新知识,真正可扩展的方向在于引入外部信号。第三条是稠密奖励的边界:OPD 的稠密奖励看似免费的午餐,但它传递的是思维路径而非分数本身,稠密监督本身也并非没有代价。三条边界拼成一张地图,认清边界正是为了突破边界。

左滑查看更多

南洋理工大学博士生黄子琪指出,视频生成模型和推理模型之间存在根本性的能力落差。前者能生成连贯画面但不懂物理因果,后者能推理因果但不会生成视频。她的方案是用推理模型做大脑、视频生成模型做手,在推理阶段注入视觉思维链来引导生成。

中国人民大学博士生金佳杰指出,自主科研Agent最难的不是写论文,是做实验。实验需要方向感、经验积累和验证闭环,恰恰是当前Agent最欠缺的三样东西。好的研究框架应该像一棵树,从宽泛的研究方向逐步分支到具体的可执行实验,每一步成败都能沉淀下来影响后续决策。目前Agent提出的想法大多来自对实验数据的归纳分析,真正的创造性飞跃仍然依赖人类。

中国人民大学李晓熙提出,真实世界智能体需要三步能力进阶:先会主动搜索,再会调用任意工具,最后打通全模态感知。三步各解决一个核心问题,搜索解决信息不足,工具解决能力边界,全模态解决感知盲区。一个值得注意的事实是,最强开源全模态模型的Agent能力与最强闭源模型差距悬殊,开源社区在Agent方向上还有巨大的追赶空间。

新加坡国立大学博士生林欣余指出,物品的表示方式与推理范式是利用推荐大模型理解用户偏好和精准推荐的核心瓶颈之一。只用协同过滤丢失语义,只用语义丢失交互信号,二者必须融合。当前序列化生成推荐列表的方式存在天然的局部最优陷阱,层级化的推理与并行生成的集合式表示是更优解,更快也更准。

左滑查看更多

中国科学院数学与系统科学研究院博士生倪雨嫣致力于AI for Science方向。她发现传统扩散模型的调度与采样机制在分子生成任务中仍存在显著优化空间,为此提出直线扩散调度、采样随机性调控与低温采样一套组合策略,在生成速度与分子结构合理性之间建立新的平衡,适配药物研发、新材料发现领域高通量分子生成的产业落地需求。

阿里通义千问研究员邱子涵认为,大模型训练中那些巨大的异常激活值不是bug,是功能。它们与归一化层协同工作,起到全局数值缩放的作用,正如发烧是免疫系统在对抗感染,不是在制造麻烦。强行压制这些异常值就像不看病因直接退烧,模型会崩掉。理解机制、在机制层面做代偿,比粗暴消灭现象重要得多。

香港大学博士生任旭滨指出,Agent不需要复杂架构,极简的推理循环加上工具调用和记忆就够了。当前主流Agent框架普遍过度设计,核心循环其实只需几十行代码。Agent框架的方向是"少即是多",足够轻量才能被每个人理解和部署,足够开放才能让社区参与进化。让软件原生支持Agent,应该成为所有产品的下一个默认状态。

香港科技大学(广州)博士生宋文轩指出,未来机器人最大的能力短板除了操作精度,还有记忆。机器人记不住十秒前把东西放进了哪个抽屉,在部分可观测场景下这是致命缺陷。他认为机器人需要像人类一样建立双重记忆系统,短期记忆应对当下任务,长期记忆存储关键历史事件,而且记忆必须包含视觉信息而不仅是文本标签。

左滑查看更多

清华大学博士生涂尚卿提出,AI教育的核心不是取代老师,而是重新定义老师。知识传授交给Agent,老师的时间回归育人:关注学生的人格、价值观和审美。教育最稀缺的资源是个性化,而AI恰好能大规模提供个性化,这不只是技术问题,更是教育公平问题。

香港大学博士生吴虓杨认为,当前AI视觉感知过于dense。处理密集图像浪费了巨量算力,而自然界的信息本身就是稀疏的。他用香港全市点云展示了稀疏感知的潜力,一个模型、一次前向计算,就能处理从城市级到桌面级的全部空间信息。稀疏不是偷懒,而是更接近智能的本质。人类虽然密集地感知世界,但只稀疏地处理信息。

香港中文大学博士生杨佳智指出,机器人强化学习的最大障碍不是算法,是真机试错的物理成本。每次实验结束,需要人工把场景中所有物体恢复原状,这个瓶颈导致强化学习在机器人领域始终无法规模化。他的解法是在训练阶段用世界模型替代真实环境,让模型在自己的想象中完成试错和学习,推理阶段完全丢弃世界模型、零额外开销。世界模型的价值不在推理时,而是在训练时。

北京大学博士生张克驰指出,代码智能体不需要全程控制,只需要在关键节点被引导。就像瓦特的调速器只控制蒸汽机阀门,不操纵整列火车。他找到那些对任务成败影响最大的决策节点,只在这些节点上做对齐,用最小干预获取最大收益。

香港中文大学博士生张昊天指出,生物分子设计行业正在陷入单模态内卷。所有人都在做蛋白设计,但生命过程涉及蛋白、RNA、小分子等多种分子的协同交互。从只能设计蛋白到同时设计蛋白、RNA、小分子,这不只是技术升级。在生物学意义上,能直接干扰DNA和只能做表观遗传,是两个截然不同的世界。

左滑查看更多

当晚的欢迎晚宴环节,智源研究院理事长黄铁军与院长王仲远共同为18位讲者颁发了「青源InnoVibe 2026——最受瞩目学术新星」奖项。

从世界模型到具身智能,从强化学习到分子设计,18位学术新星的研究画出同一个信号——AI正从"能说会道"进入"能做事、懂物理、会科研"的深水区,而驱动这场变革的核心力量,正在变得越来越年轻。

大会回放 https://2026.baai.ac.cn

内容中包含的图片若涉及版权问题,请及时与我们联系删除