9道Erdős开放难题一次性告破
数学界这个月彻底疯了,前脚OpenAI刚把Erdős 80年猜想推翻,紧接着Google DeepMind发布了全新AI数学智能体AlphaProof Nexus。它一出手,就解决了9道悬而未决几十年的Erdős开放问题,其中最古老的悬了56年。而且,每道题花费的算力成本只有几百美元。更关键的是,这次的证明经过Lean编译器的形式化验证,不存在幻觉空间。
AlphaProof Nexus架构与工作流
AlphaProof Nexus和2024年拿下IMO银牌的初代AlphaProof不同,它把大语言模型、AlphaProof和进化算法三合一。其系统架构分为四个层级,从简单到复杂。工作流的核心循环是AI提出证明草稿,Lean编译器验证,失败则反馈错误信息,AI修正后再验证,循环往复,直到证明通过或耗尽算力预算。
9道问题具体情况
DeepMind将完整版Agent D投放到353道已形式化的Erdős问题上,最终攻克9道。如Erdős #12悬置56年,AI结合中国剩余定理和三项等差数列回避集给出解法;Erdős #125,AI证明答案否定,核心是归纳稀疏化论证;Erdős #138,AI给出优雅证明;Erdős #846,AI构造令人叹为观止。目前9道问题的Lean证明代码已开源在GitHub上。
简单Agent也能解全部9题
最出人意料的是,最简单的Agent A也能解决全部9道问题。它没有进化算法和AlphaProof,只有多个独立的LLM子智能体和Lean编译器的反馈循环。Agent A和Agent B表现相近,Agent D在最困难问题上有成本优势。DeepMind将基础Agent的成功归因于LLM能力飙升和编译器反馈的强大作用。
多领域取得突破
除了Erdős问题,AlphaProof Nexus还在多个数学分支取得实质性突破。在OEIS猜想中,系统自动形式化492个开放猜想,证明44个;代数几何中,解决约15年悬置问题;凸优化中,解决关于锚定梯度下降 - 上升算法精确收敛速率问题,还发现新学习率调度参数;图论中,证明Graffiti系统猜想;加法组合学中,解决Ben Green开放问题列表第57题;量子光学中,与Mario Krenn合作解决多个单色量子图猜想。
AI改变数学研究方式
2026年5月,AI在数学领域造诣达到研究级水平。OpenAI走自然语言路线,DeepMind走形式化验证路线。自然语言路线灵活但可能有幻觉,形式化路线可靠但有领域局限。DeepMind的数学家合作者发现,即使智能体无法证明目标定理,其生成的证明尝试也能加深他们对问题的理解。未来,AI先用自然语言探索思路,再用形式化系统验证,人类数学家角色转变。有人说,我们正目睹数学奇点的早期火花。