- 简介尽管以往的AI科学家系统能够生成新颖的发现,但它们往往缺乏足够的聚焦能力,难以产出针对人类迫切需求的科学挑战具有实际价值的成果。我们提出了DeepScientist系统,旨在通过在长达数月的时间尺度上进行目标导向、完全自主的科学探索来克服这一局限。该系统将科学发现形式化为一个贝叶斯优化问题,并通过“提出假设、验证和分析”这一分层评估流程加以实现。借助一个持续积累的“发现记忆”机制,该循环智能地平衡了对新假设的探索与对已有成果的深化利用,有选择地将最具前景的发现推进到更高保真度的验证层级。该系统累计消耗超过20,000 GPU小时,生成了约5,000个独特的科学构想,并对其中约1,100个进行了实验验证,最终在三项前沿人工智能任务上分别以183.7%、1.9%和7.9%的表现超越了人类设计的最先进(SOTA)方法。本研究首次提供了大规模证据,表明人工智能能够在科学任务中持续取得超越人类顶尖水平的发现,产出了真正推动科学前沿进展的重要成果。为了促进对该过程的进一步研究,我们将开源全部实验日志和系统代码,地址为 https://github.com/ResearAI/DeepScientist/。
-
- 图表
- 解决问题论文试图解决AI系统在自主科学发现过程中缺乏目标导向性、难以持续产生具有实际科学价值的成果的问题。传统AI科学家系统虽然能生成新颖发现,但往往无法聚焦于人类定义的重要挑战,导致产出缺乏实际意义。这个问题在当前AI驱动科研的背景下尤为重要,且尚未被充分解决,因此具有一定的新颖性。
- 关键思路DeepScientist将科学发现建模为贝叶斯优化问题,通过‘假设-验证-分析’的层次化闭环流程实现目标导向的长期自主探索。其核心创新在于引入‘发现记忆库(Findings Memory)’机制,动态平衡探索与利用,并在多层级验证中逐步提升假设的保真度,从而实现月级跨度的持续、累积式科学发现。相比以往一次性或短周期的AI科研系统,该方法首次实现了长期、渐进超越人类SOTA的自主发现能力。
- 其它亮点系统在超过20,000 GPU小时的计算资源下生成约5,000个独特科学想法,实验验证了其中1,100个,并在三个前沿AI任务上分别超越人类设计的SOTA方法达183.7%、1.9%和7.9%。这是首个大规模证据表明AI可在科学任务上持续超越人类顶尖水平。实验设计采用分层验证框架,确保结果可靠性。作者承诺开源全部实验日志与系统代码(https://github.com/ResearAI/DeepScientist/),极大促进可复现性与后续研究。未来可深入探索其在生物、材料等复杂科学领域的应用。
- 1. 'A Robot Scientist that Intelligently Automates Scientific Discovery' (King et al., Science 2009) 2. 'AI Feynman: A Physics-Inspired Method for Symbolic Regression' (Mangoni & Traversa, Nature Communications 2020) 3. 'The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery' (Wu et al., arXiv 2024) 4. 'AutoSynth: Automated Hypothesis Generation via Large Language Models' (Chen et al., ICML 2023) 5. 'Bayesian Optimization for Scientific Discovery' (Gonzalez et al., NeurIPS 2021)
- 1
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流