
新智元报道
新智元报道
【新智元导读】最近,大家都被这条消息吓到了:传说Grok 3已经成功证明出黎曼猜想?!虽然这是在玩梗,但还是让我们来仔细剖析下,目前的AI距离千禧年数学难题,究竟还有多远。

2000年,黎曼猜想被美国克雷数学研究所(Clay Mathematics Institute of Cambridge,CMI)指定为「七大千禧年难题之一」









要攻克黎曼猜想,还差些什么?




虽然是一个弱一点的形式,但本质上已经是解决了朗道—西格尔零点问题。
论文链接:https://arxiv.org/abs/2211.02515

AI的数学能力,到底什么水平?
这么说起来,目前的AI是否真的有证明黎曼猜想的能力呢? 我们可以来看看,爆火全网的AI证明工具AlphaProof,是如何做出IMO 2024的三道题的。 从某种角度来说,IMO数学竞赛题跟「猜想界的皇冠」黎曼猜想距离有多远,那离AI证明黎曼猜想也就有多远。 谷歌DeepMind研究人员,AlphaProof负责人Rishi Mehta最新博客中,介绍了AlphaProof在IMO中的最新表现。 
4个月前,谷歌DeepMind团队发布了两个数学推理新模型AlphaProof和AlphaGeometry 2。 前者在破解IMO 2024六道竞赛试题中,做对了其中4道,而且每道题拿下了满分,相当于银牌选手水平(28分)。 
而在最新进展文章中,Mehta揭示了AlphaProof在IMO 2024解题中最酷的想法。 在证明过程中,AlphaProof会使用到Lean 生成证明,并且每个Lean证明由一系列策略组成。 因此,Mehta将挑选出对应于这些想法的策略,针对AlphaProof解决的第 1、2和6题进行分析。


问题 1
existsλx L=>(L 2 two_pos).rec λl Y=>?_
constructor· intro x Lobtain ⟨l, Y⟩ := L 2 (by exact two_pos)
suffices: ∀ (n : ℕ),⌊(n+1)*x⌋ =⌊ x⌋+2 * ↑ (n : ℕ) * (l-(⌊(x)⌋))
use(l-⌊x⌋)*2
上下滑动查看
问题 2
suffices:b.1*b.2+1∣Y
aϕ(ab+1)≡1(modab+1)
问题 6

specialize V $ λ N=>-N+2 *Int.ceil N
use Finset.one_lt_card.2$ by exists@0,V.1.mem_toFinset.2 (by exists-1),2,V.1.mem_toFinset.2 (by exists 1/2)
上下滑动查看
AI距离千禧年难题,还有多远?
关于AI究竟能做什么程度的数学题,网友们也就此展开了讨论。 很多人认为,数学将是AI最先突破的领域之一,因为存在一个可用的既便宜又快速的反馈循环。 数学具有这样的特性:你可以以很少的成本,100%去验证你所做的事是否正确。 而相对于Lean之类的数学证明工具来说,AI验证实验的成本(时间、精力、金钱、安全)都要高出许多数量级。 
有网友脑洞大开预测道:数学前沿运动的加速,值得人类建更多发电站! 
不过,有一名数学家却在评论区现身说法,认为并不值得用AI这么做。 在他看来,计算时间/成本与问题复杂性之间的权衡,值得严肃考虑。 理论上讲,用形式语言找到证明是一件很轻松的事,因为只需一直搜索可能的证明,直到找到所需陈述结尾的证明就可以了。 计算的并行化程度如何,硬件能力有多大,AI工具对于数学问题的优化程度如何,都会决定AI用多长时间把证明做出来。 但要说专门建数据中心和发电站,把大量能源用于做数学题,他觉得没有必要——因为这并不是为了数学界的利益,而是硅谷大厂们自己的愿景。 
不过如果进一步设想,现在的Alphaproof如果变成具有天文数字计算资源的定理证明器,我们或许有一天就可以证明「P/NP问题」。 因为,任何可证明的定理,都可以通过耐心地使用穷举法,列举所有可能的证明来找到。 如果存在一个有限的、格式良好的公式,该公式具有该定理作为结果,那么该定理就可以根据定义证明。
而如果说LLM有什么用处,那就是寻找出令人惊讶的联系,以人类搜索之外的方式,应用现有工具。 AI通过帮助人类解决引理、检查错误、形式化证明,来加速数学研究,在肉眼可见的未来几年内,即将成为现实。 而在去年,微软亚洲研究院、北大、北航等机构的研究人员,就已经通过97个回合的「苏格拉底式」严格推理,成功让GPT-4得出了「P≠NP」的结论。 而这97轮对话,可以说构建出了一个极难的NP完全问题,其中一些实例在时间复杂度低于O(2^n)(即穷举搜索)的情况下是不可解的,也就是说,证明结论为P≠NP。








内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢