- 简介AlphaEvolve 是一种通用的进化式编程智能体,它将大语言模型的生成能力与自动化评估相结合,置于一个迭代进化的框架之中,能够提出、测试并逐步优化针对复杂科学与实际问题的算法解决方案。本文展示了 AlphaEvolve 作为一种自主发现全新数学构造、推动对长期未解难题理解的工具。为展示其广泛适用性,我们选取了涵盖数学分析、组合数学、几何学和数论等领域的 67 个问题进行实验。该系统在大多数情况下重新发现了目前已知的最佳解,并在多个问题上找到了更优的解法。在某些情况下,AlphaEvolve 还能将有限输入值下的结果推广为适用于所有输入值的通用公式。此外,我们还能将这一方法与 Deep Think 和 AlphaProof 相结合,构建一个更广泛的框架,其中额外的证明辅助工具和推理系统可提供自动化的定理证明与更深入的数学洞见。 这些结果表明,由大语言模型引导的进化搜索能够自主发现补充人类直觉的数学构造,在某些情况下甚至达到或超越现有最佳成果,凸显了数学家与人工智能系统之间实现全新互动方式的巨大潜力。我们提出 AlphaEvolve 作为一种强大的新型数学发现工具,能够在大规模复杂优化问题中探索广阔的搜索空间,通常还能显著降低前期准备和计算时间的需求。
-
- 图表
- 解决问题论文试图解决如何利用人工智能自主发现数学构造并推进对长期未解数学问题的理解,特别是在数学分析、组合数学、几何和数论等领域中寻找新的或改进的解法。这一问题在AI for Science背景下日益重要,但将大语言模型与自动化评估结合用于数学发现仍属较新方向。
- 关键思路AlphaEvolve 提出一种基于大语言模型(LLM)的进化编码框架,通过提出-测试-优化的迭代过程自动生成、评估和改进算法解决方案。其核心创新在于将LLM的生成能力与自动化测试反馈相结合,并可集成 Deep Think 和 AlphaProof 实现自动证明与深层推理,形成闭环的数学发现系统。相比现有方法,该框架更强调自主性、通用性和可扩展性。
- 其它亮点系统在67个跨领域数学问题上进行了测试,多数情况下复现了已知最优解,并在多个问题中发现了更优解;部分结果实现了从有限输入到通式推广;实验设计包含多轮演化迭代与自动验证机制;未提及具体开源代码,但展示了与AlphaProof等系统的集成潜力;未来值得深入探索其在定理发现、形式化数学和人机协同研究中的应用。
- 1. AlphaProof: A Language Model for Theorem Proving (Google DeepMind, 2024) 2. DeepSeekMath: Towards Mathematical Reasoning via Joint Training (DeepSeek, 2023) 3. LeanDojo: Learning to Prove Theorems with Lean (ICML 2023) 4. FunSearch: Evolutionary Problem Solving with LLMs (Nature, 2023) 5. Mathematical Reasoning via Self-Supervised Fine-Tuning (ICLR 2022)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流