Google 发布「Gemini for Science」计划，AI科学家雏形来了

编辑：李宝珠

转载请联系本公众号获得授权，并标明来源

Google 发布「Gemini for Science」计划，首次系统性地将 Gemini、AlphaEvolve、NotebookLM、Co-Scientist 等能力整合为一套面向科研场景的 AI 工作流。

过去两年，人们已经习惯于用大模型写代码、做搜索、生成内容。但在 Google 看来，这些还只是 AI 能力的外围应用。更重要的问题是：

AI 是否能够真正参与科学研究本身？

5 月 19 日，Google 发布「Gemini for Science」计划，首次系统性地将 Gemini、AlphaEvolve、NotebookLM、Co-Scientist 等能力整合为一套面向科研场景的 AI 工作流，并推出三项实验性工具：

Hypothesis Generation（假设生成）

与 Co-Scientist 合作构建，模拟完整科学方法——与研究者共同定义课题，通过多智能体「想法锦标赛」自动生成、辩论和评估假设，所有论断均附带可点击引用，确保严谨性。

Computational Discovery（计算发现）

基于 AlphaEvolve 与 ERA 构建，并行生成并评分数千种代码变体，使科研人员能以计算实验方式快速测试大量新建模方案，适用于太阳辐射预测、流行病学等复杂领域。

Literature Insights（文献洞察）

整合 NotebookLM 能力，从科学文献中搜索并组织结果至可检索表格，支持侧面对比分析，还可生成报告、幻灯片、信息图以及音视频摘要，帮助发现研究空白。

与此前偏单点能力的科研 AI 工具不同，这次 Google 的重点已经不再是「某个模型能做什么」，而是试图构建一套贯穿科研流程的 AI 协作体系。从文献阅读，到假设提出，再到计算实验与结果分析，Gemini 正被推向一个更接近「科研 Agent」的位置。

科研最大的瓶颈，正在从「算力」转向「信息处理」

Google 在发布中提到，全球每年新增数百万篇学术论文，研究成果分散在不同数据库、代码仓库与实验记录中，研究者越来越难以完整跟踪领域进展。

这意味着，现代科研正在出现一个典型矛盾：一方面，科学知识以前所未有的速度增长；另一方面，人类研究者处理信息的能力并没有同步提升。

AI for Science 的真正机会，也由此产生。

过去几年，行业中的大部分科研 AI 系统，本质上仍然是「工具型 AI」，例如做蛋白质结构预测；加速材料筛选；优化数值计算；自动生成代码等等，但 Google 这次明显更进一步——开始尝试让 AI 参与「科学推理过程」本身。

Co-Scientist：Google 开始让 AI 模拟科研讨论

三项工具中，最值得关注的是 Hypothesis Generation，其底层来自 Google 此前披露的 Co-Scientist 系统。

传统大模型通常是单轮生成答案，但 Co-Scientist 采用的是一种多智能体（multi-agent）结构。在用户输入研究主题后，系统会生成多个不同角色的 AI Agent，并通过类似「组会讨论」的方式进行协作：

* 提出研究假设

* 相互批判与辩论

* 引用文献证据

* 对方案进行排序评估

Google 将这一机制称为「Idea Tournament」，本质上是在模拟科研中的同行讨论过程。而这一方向的重要性在于，将大模型的定位逐渐从「语言生成器」转向「推理协作系统」。尤其在科研领域，真正有价值的往往并不是答案本身，而是如何提出假设、验证推理路径、审查文献依据等任务。

生成的想法会被反复迭代优化、批判与演化，进而形成新的假设，从而构建起一个科学推理与假设生成的良性循环

尽管距离真正意义上的「AI 科学家」还有明显距离，但 Co-Scientist 已经展示出一种新的可能——AI 不只是科研工具，而可能成为科研流程中的协作者。

AlphaEvolve 与 ERA：让 AI 自动进行「计算实验」

如果说 Co-Scientist 更偏向科研思维，那么 Computational Discovery 则更偏向实验自动化。这一系统基于 AlphaEvolve 与 ERA（Empirical Research Agent）构建，核心逻辑是让 AI 自动生成、测试并优化大量代码方案。

在传统科研中，一个建模问题往往需要反复经历参数调整、代码修改、实验运行、结果比较、再次迭代的过程，高度依赖研究者经验，同时也消耗大量时间。而 ERA 的思路则是将这一循环部分自动化。Google 表示，系统能够并行生成并评估数千种代码变体，以搜索更优建模方案，目前已被用于太阳能系统设计、流行病学建模等方向的探索研究。

具体而言，ERA 可搜索文献、编写代码、探索方案、组合技术并评估结果，采用树搜索算法在数千种方案中寻找最优代码路径。在基准测试中，ERA 在基因组学、公共卫生、卫星影像分析、神经科学预测、时序预测及数学等跨学科问题上均达到专家级表现。

实际应用方面，ERA 已产出 8 篇科学论文：包括在美国 CDC 排行榜上排名前列的流感与新冠住院预测模型、加州融雪径流预报（优于州官方方案）、基于静止卫星数据的高时空分辨率 CO₂ 浓度映射、太阳能装置优化及零售预测等。

2024 年 10 月 18 日南加州上空的大气二氧化碳浓度

轨道碳观测卫星 2 号（Orbiting Carbon Observatory-2）沿单一路径进行高精度测量（左图），并以 16 天为周期返回同一地点。ERA 则利用 GOES-East 气象卫星数据，并结合其他信息（右图），对全球范围内的二氧化碳浓度进行每 10 分钟一次的估算

NotebookLM 进入科研场景

第三项工具 Literature Insights，则建立在 NotebookLM 能力基础之上，主要解决的是科研场景中的信息过载问题。对于生命科学、材料科学等论文密度极高的领域而言，这类工具的实际价值可能远超通用聊天机器人。因为许多研究中的真正瓶颈，已经不是缺少知识，而是无法有效处理知识。

该系统能够检索与整理科学文献、自动抽取实验结果、横向比较研究结论并输出结构化分析结果，随后还能进一步生成研究摘要、报告、信息图等素材，甚至还能输出音视频形式的内容总结。这意味着，NotebookLM 正在从「AI 笔记工具」，转向「科研知识工作台」。

从工具到系统：Google 拼出「科研 AI 栈」

相比单点产品，这次更值得关注的是 Google 的整体架构化布局。目前其科研 AI 能力链条已初步成型：

* Google Scholar：文献入口

* Colab：计算环境

* AlphaFold：结构预测

* NotebookLM：知识管理

* Gemini：通用推理

* Co-Scientist：科研Agent

此次 Gemini for Science 的推出，标志着这些能力开始被统一整合进科研工作流。同时，Google还推出「Science Skills」能力集合，整合 AlphaFold、AlphaGenome 等30余个生命科学数据库，在部分测试场景中，该系统可将原本数小时级别的生物信息学分析压缩至分钟级。

参考资料：
1.https://blog.google/innovation-and-ai/technology/research/gemini-for-science-io-2026/
2.https://research.google/blog/empirical-research-assistance-era-from-nature-publication-to-catalyzing-computational-discovery/

一键获取 2023—2024 年 AI4S 领域高质量论文及深度解读文章 ⬇️

往期推荐

戳“阅读原文”，免费获取海量数据集资源！

内容中包含的图片若涉及版权问题，请及时与我们联系删除