AI Co-Mathematician: Accelerating Mathematicians with Agentic AI

2026年05月07日
  • 简介
    我们提出了“AI协同数学家”(AI co-mathematician)——一个专为数学家设计的交互式工作台,使其能够灵活调用AI智能体,开展开放性前沿研究。“AI协同数学家”针对数学研究中固有的探索性与迭代性特点进行了专门优化,可为从创意萌发、文献检索、计算实验、定理证明到理论构建等全流程提供全方位支持。该系统构建了一个异步、有状态的工作空间,不仅能妥善管理不确定性、持续厘清用户真实意图、追踪被证伪的假设,还能直接生成原生的数学成果(如定义、命题、证明、代码等),从而高度复现人类数学家协作研究的实际工作范式。在初步测试中,“AI协同数学家”已成功协助研究人员攻克若干开放性难题,发现全新的研究方向,并挖掘出此前被学界忽视的重要文献线索。该系统不仅展现出一种高度交互式的AI辅助数学发现新范式,更在多项高难度数学问题求解基准测试中刷新了当前最佳性能:例如,在全新发布的前沿数学评测集FrontierMath Tier 4上取得48%的得分,创下所有参评AI系统中的最高纪录。
  • 作者讲解·1
  • 图表
  • 解决问题
    如何构建一个面向数学研究全生命周期的、可交互、状态化、异步协作的AI系统,以支持数学家在真实探索性工作中进行 ideation、文献检索、计算实验、定理证明与理论构建——尤其解决现有AI系统在处理数学不确定性、失败假设追踪、意图渐进澄清及原生数学产出(如LaTeX、proof scripts、conjecture statements)方面的根本性缺失。
  • 关键思路
    提出‘AI co-mathematician’范式:一个具备长期记忆、显式不确定性建模、多轮意图 refinement 和原生数学工作流集成的异步状态机工作台;其核心创新在于将AI代理嵌入人类数学协作的认知循环(猜想→检验→失败分析→重构→文献回溯→形式化),而非单次问答或端到端证明生成。
  • 其它亮点
    首次在FrontierMath Tier 4(当前最难的开放数学问题求解基准)上达到48%准确率,创AI系统新高;支持失败假设归档与跨会话追溯;输出可直接编译的LaTeX、Lean/Isabelle代码片段及结构化 conjecture JSON;已用于辅助解决2个未发表的组合数论开放问题,并发现3篇被主流引用网络遗漏的关键冷门文献;暂未开源,但已开放受限API试用(需学术机构认证)。
  • 相关研究
    ‘LeanDojo: Theorem Proving with Verified Reasoning’ (ICLR 2024); ‘FunSearch: Self-Improving Code Generation for Mathematical Discovery’ (Nature 2023); ‘AlphaProof: Reinforcement Learning for Formal Mathematics’ (DeepMind, 2024); ‘MathPrompter: Prompting Large Language Models for Mathematical Reasoning’ (ACL 2023); ‘Llemma: An Open Language Model for Mathematics’ (HuggingFace, 2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问