NEW

Kosmos: An AI Scientist for Autonomous Discovery

Ludovico Mitchener ,

Angela Yiu ,

Benjamin Chang ,

Mathieu Bourdenx ,

Tyler Nadolski ,

Arvis Sulovari ,

Eric C. Landsness ,

Daniel L. Barabasi ,

Siddharth Narayanan ,

Nicky Evans ,

Shriya Reddy ,

Martha Foiani ,

Aizad Kamal ,

Leah P. Shriver ,

Fang Cao ,

Asmamaw T. Wassie ,

Jon M. Laurent ,

Edwin Melville-Green ,

Mayk Caldas ,

Albert Bou ,

Kaleigh F. Roberts ,

Sladjana Zagorac ,

Timothy C. Orr ,

Miranda E. Orr ,

Kevin J. Zwezdaryk ,

Ali E. Ghareeb ,

Laurie McCoy ,

Bruna Gomes ,

Euan A. Ashley ,

Karen E. Duff ,

Tonio Buonassisi ,

Tom Rainforth ,

Randall J. Bateman ,

Michael Skarlinski ,

Samuel G. Rodriques ,

Michaela M. Hinks ,

Andrew D. White

热度 1730

2025年11月04日

简介

以数据驱动的科学发现需要经历文献检索、提出假设和数据分析的反复循环过程。尽管在能够自动化开展科学研究的人工智能代理方面已取得显著进展，但现有各类系统均受限于其在失去连贯性之前所能执行的操作数量，从而限制了它们发现成果的深度。本文提出了Kosmos，一种实现数据驱动科学发现自动化的AI科学家。给定一个开放性的研究目标和一个数据集后，Kosmos可连续运行长达12小时，执行多轮并行的数据分析、文献检索和假设生成，最终将发现成果整合成科学报告。与以往系统不同，Kosmos采用一种结构化的世界模型，使数据分析代理和文献检索代理之间能够共享信息。该世界模型使Kosmos能够在超过200次的代理推演过程中始终保持连贯性，每次运行平均共执行约42,000行代码，并阅读1,500篇论文。Kosmos报告中的每一项陈述均通过代码或原始文献加以引用，确保其推理过程可追溯。独立科学家评估发现，Kosmos报告中79.4%的陈述是准确的；合作研究人员表示，单次包含20个循环的Kosmos运行平均相当于他们自身六个月的研究工作量。此外，合作者指出，Kosmos产生的有价值科学发现的数量随运行循环次数呈线性增长（实验最多验证至20个循环）。我们重点介绍了Kosmos在代谢组学、材料科学、神经科学和统计遗传学等领域取得的七项科学发现：其中三项独立重现了Kosmos运行时并未接触过的预印本或未发表手稿中的研究成果，另外四项则为科学文献作出了全新的贡献。
图表
解决问题

论文试图解决AI在科学发现中因行动序列过长而失去连贯性的问题，导致现有AI系统难以进行深度、迭代式的科研任务。这是一个尚未被充分解决的新问题，尤其是在实现长期、自主、跨模块协同的自动化科学发现方面。
关键思路

提出Kosmos，一个基于结构化世界模型的AI科学家，通过共享数据分析师和文献搜索代理之间的信息状态，实现长达200步以上的连贯推理与操作。其核心创新在于引入世界模型来维持长期记忆与目标一致性，使多轮并行的数据分析、假设生成和文献检索能够协同推进。
其它亮点

Kosmos可在12小时内完成20个完整科研循环，平均执行4.2万行代码、阅读1500篇论文，并生成可追溯的科学报告；实验显示79.4%的陈述被独立科学家认为准确；协作研究人员评估称单次20周期运行相当于6个月人工研究工作量；发现成果涵盖代谢组学、材料科学等多个领域，其中3项独立复现了未公开研究成果，4项为全新贡献；目前未提及开源代码，但系统设计具有高度可扩展性，值得进一步探索其在不同学科的应用。
相关研究

相关研究包括：'A robotic AI chemist that conducts autonomous research'（Nature, 2020）；'Machine scientist uncovers hidden patterns in scientific data'（PNAS, 2021）；'Automated hypothesis generation using large-scale knowledge graphs'（Science Advances, 2022）；'Agent-based artificial intelligence for scientific discovery'（arXiv:2305.15326）；以及Google DeepMind的AI for protein structure prediction系列工作（AlphaFold系列）。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问