编辑:李宝珠

转载请联系本公众号获得授权,并标明来源


Google 发布「Gemini for Science」计划,首次系统性地将 Gemini、AlphaEvolve、NotebookLM、Co-Scientist 等能力整合为一套面向科研场景的 AI 工作流。


过去两年,人们已经习惯于用大模型写代码、做搜索、生成内容。但在 Google 看来,这些还只是 AI 能力的外围应用。更重要的问题是:

AI 是否能够真正参与科学研究本身?

5 月 19 日,Google 发布「Gemini for Science」计划,首次系统性地将 Gemini、AlphaEvolve、NotebookLM、Co-Scientist 等能力整合为一套面向科研场景的 AI 工作流,并推出三项实验性工具:

Hypothesis Generation(假设生成)

与 Co-Scientist 合作构建,模拟完整科学方法——与研究者共同定义课题,通过多智能体「想法锦标赛」自动生成、辩论和评估假设,所有论断均附带可点击引用,确保严谨性。

Computational Discovery(计算发现)

基于 AlphaEvolve 与 ERA 构建,并行生成并评分数千种代码变体,使科研人员能以计算实验方式快速测试大量新建模方案,适用于太阳辐射预测、流行病学等复杂领域。

Literature Insights(文献洞察)

整合 NotebookLM 能力,从科学文献中搜索并组织结果至可检索表格,支持侧面对比分析,还可生成报告、幻灯片、信息图以及音视频摘要,帮助发现研究空白。


与此前偏单点能力的科研 AI 工具不同,这次 Google 的重点已经不再是「某个模型能做什么」,而是试图构建一套贯穿科研流程的 AI 协作体系。从文献阅读,到假设提出,再到计算实验与结果分析,Gemini 正被推向一个更接近「科研 Agent」的位置。

科研最大的瓶颈,正在从「算力」转向「信息处理」

Google 在发布中提到,全球每年新增数百万篇学术论文,研究成果分散在不同数据库、代码仓库与实验记录中,研究者越来越难以完整跟踪领域进展。

这意味着,现代科研正在出现一个典型矛盾:一方面,科学知识以前所未有的速度增长;另一方面,人类研究者处理信息的能力并没有同步提升。

AI for Science 的真正机会,也由此产生。

过去几年,行业中的大部分科研 AI 系统,本质上仍然是「工具型 AI」,例如做蛋白质结构预测;加速材料筛选;优化数值计算;自动生成代码等等,但 Google 这次明显更进一步——开始尝试让 AI 参与「科学推理过程」本身。

Co-Scientist:Google 开始让 AI 模拟科研讨论

三项工具中,最值得关注的是 Hypothesis Generation,其底层来自 Google 此前披露的 Co-Scientist 系统。

传统大模型通常是单轮生成答案,但 Co-Scientist 采用的是一种多智能体(multi-agent)结构。在用户输入研究主题后,系统会生成多个不同角色的 AI Agent,并通过类似「组会讨论」的方式进行协作:

* 提出研究假设

* 相互批判与辩论

* 引用文献证据

* 对方案进行排序评估


Google 将这一机制称为「Idea Tournament」,本质上是在模拟科研中的同行讨论过程。而这一方向的重要性在于,将大模型的定位逐渐从「语言生成器」转向「推理协作系统」。尤其在科研领域,真正有价值的往往并不是答案本身,而是如何提出假设、验证推理路径、审查文献依据等任务。


生成的想法会被反复迭代优化、批判与演化,进而形成新的假设,从而构建起一个科学推理与假设生成的良性循环


尽管距离真正意义上的「AI 科学家」还有明显距离,但 Co-Scientist 已经展示出一种新的可能——AI 不只是科研工具,而可能成为科研流程中的协作者。

AlphaEvolve 与 ERA:让 AI 自动进行「计算实验」

如果说 Co-Scientist 更偏向科研思维,那么 Computational Discovery 则更偏向实验自动化。这一系统基于 AlphaEvolve 与 ERA(Empirical Research Agent)构建,核心逻辑是让 AI 自动生成、测试并优化大量代码方案。


在传统科研中,一个建模问题往往需要反复经历参数调整、代码修改、实验运行、结果比较、再次迭代的过程,高度依赖研究者经验,同时也消耗大量时间。而 ERA 的思路则是将这一循环部分自动化。Google 表示,系统能够并行生成并评估数千种代码变体,以搜索更优建模方案,目前已被用于太阳能系统设计、流行病学建模等方向的探索研究。


具体而言,ERA 可搜索文献、编写代码、探索方案、组合技术并评估结果,采用树搜索算法在数千种方案中寻找最优代码路径。在基准测试中,ERA 在基因组学、公共卫生、卫星影像分析、神经科学预测、时序预测及数学等跨学科问题上均达到专家级表现。


实际应用方面,ERA 已产出 8 篇科学论文:包括在美国 CDC 排行榜上排名前列的流感与新冠住院预测模型、加州融雪径流预报(优于州官方方案)、基于静止卫星数据的高时空分辨率 CO₂ 浓度映射、太阳能装置优化及零售预测等。


2024 年 10 月 18 日南加州上空的大气二氧化碳浓度


轨道碳观测卫星 2 号(Orbiting Carbon Observatory-2)沿单一路径进行高精度测量(左图),并以 16 天为周期返回同一地点。ERA 则利用 GOES-East 气象卫星数据,并结合其他信息(右图),对全球范围内的二氧化碳浓度进行每 10 分钟一次的估算

NotebookLM 进入科研场景

第三项工具 Literature Insights,则建立在 NotebookLM 能力基础之上,主要解决的是科研场景中的信息过载问题。对于生命科学、材料科学等论文密度极高的领域而言,这类工具的实际价值可能远超通用聊天机器人。因为许多研究中的真正瓶颈,已经不是缺少知识,而是无法有效处理知识。


该系统能够检索与整理科学文献、自动抽取实验结果、横向比较研究结论并输出结构化分析结果,随后还能进一步生成研究摘要、报告、信息图等素材,甚至还能输出音视频形式的内容总结。这意味着,NotebookLM 正在从「AI 笔记工具」,转向「科研知识工作台」。

从工具到系统:Google 拼出「科研 AI 栈」

相比单点产品,这次更值得关注的是 Google 的整体架构化布局。目前其科研 AI 能力链条已初步成型:

* Google Scholar:文献入口

* Colab:计算环境

AlphaFold:结构预测

NotebookLM:知识管理

Gemini:通用推理

Co-Scientist:科研Agent


此次 Gemini for Science 的推出,标志着这些能力开始被统一整合进科研工作流。同时,Google还推出「Science Skills」能力集合,整合 AlphaFold、AlphaGenome 等30余个生命科学数据库,在部分测试场景中,该系统可将原本数小时级别的生物信息学分析压缩至分钟级。


参考资料:
1.https://blog.google/innovation-and-ai/technology/research/gemini-for-science-io-2026/
2.https://research.google/blog/empirical-research-assistance-era-from-nature-publication-to-catalyzing-computational-discovery/


一键获取 2023—2024 年 AI4S 领域高质量论文及深度解读文章 ⬇️

 往期推荐 

“阅读原文”,免费获取海量数据集资源!


内容中包含的图片若涉及版权问题,请及时与我们联系删除