DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively

2025年09月30日
  • 简介
    尽管以往的AI科学家系统能够生成新颖的发现,但它们往往缺乏足够的聚焦能力,难以产出针对人类迫切需求的科学挑战具有实际价值的成果。我们提出了DeepScientist系统,旨在通过在长达数月的时间尺度上进行目标导向、完全自主的科学探索来克服这一局限。该系统将科学发现形式化为一个贝叶斯优化问题,并通过“提出假设、验证和分析”这一分层评估流程加以实现。借助一个持续积累的“发现记忆”机制,该循环智能地平衡了对新假设的探索与对已有成果的深化利用,有选择地将最具前景的发现推进到更高保真度的验证层级。该系统累计消耗超过20,000 GPU小时,生成了约5,000个独特的科学构想,并对其中约1,100个进行了实验验证,最终在三项前沿人工智能任务上分别以183.7%、1.9%和7.9%的表现超越了人类设计的最先进(SOTA)方法。本研究首次提供了大规模证据,表明人工智能能够在科学任务中持续取得超越人类顶尖水平的发现,产出了真正推动科学前沿进展的重要成果。为了促进对该过程的进一步研究,我们将开源全部实验日志和系统代码,地址为 https://github.com/ResearAI/DeepScientist/。
  • 作者讲解·1
  • 图表
  • 解决问题
    论文试图解决AI系统在自主科学发现过程中缺乏目标导向性、难以持续产生具有实际科学价值的成果的问题。传统AI科学家系统虽然能生成新颖发现,但往往无法聚焦于人类定义的重要挑战,导致产出缺乏实际意义。这个问题在当前AI驱动科研的背景下尤为重要,且尚未被充分解决,因此具有一定的新颖性。
  • 关键思路
    DeepScientist将科学发现建模为贝叶斯优化问题,通过‘假设-验证-分析’的层次化闭环流程实现目标导向的长期自主探索。其核心创新在于引入‘发现记忆库(Findings Memory)’机制,动态平衡探索与利用,并在多层级验证中逐步提升假设的保真度,从而实现月级跨度的持续、累积式科学发现。相比以往一次性或短周期的AI科研系统,该方法首次实现了长期、渐进超越人类SOTA的自主发现能力。
  • 其它亮点
    系统在超过20,000 GPU小时的计算资源下生成约5,000个独特科学想法,实验验证了其中1,100个,并在三个前沿AI任务上分别超越人类设计的SOTA方法达183.7%、1.9%和7.9%。这是首个大规模证据表明AI可在科学任务上持续超越人类顶尖水平。实验设计采用分层验证框架,确保结果可靠性。作者承诺开源全部实验日志与系统代码(https://github.com/ResearAI/DeepScientist/),极大促进可复现性与后续研究。未来可深入探索其在生物、材料等复杂科学领域的应用。
  • 相关研究
    1. 'A Robot Scientist that Intelligently Automates Scientific Discovery' (King et al., Science 2009) 2. 'AI Feynman: A Physics-Inspired Method for Symbolic Regression' (Mangoni & Traversa, Nature Communications 2020) 3. 'The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery' (Wu et al., arXiv 2024) 4. 'AutoSynth: Automated Hypothesis Generation via Large Language Models' (Chen et al., ICML 2023) 5. 'Bayesian Optimization for Scientific Discovery' (Gonzalez et al., NeurIPS 2021)
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问