news 2026/5/27 22:54:37

DeepMind新AI智能体AlphaProof Nexus:9道Erdős难题告破,56年悬案一朝解决!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepMind新AI智能体AlphaProof Nexus:9道Erdős难题告破,56年悬案一朝解决!

9道Erdős开放难题一次性告破

数学界这个月彻底疯了,前脚OpenAI刚把Erdős 80年猜想推翻,紧接着Google DeepMind发布了全新AI数学智能体AlphaProof Nexus。它一出手,就解决了9道悬而未决几十年的Erdős开放问题,其中最古老的悬了56年。而且,每道题花费的算力成本只有几百美元。更关键的是,这次的证明经过Lean编译器的形式化验证,不存在幻觉空间。

AlphaProof Nexus架构与工作流

AlphaProof Nexus和2024年拿下IMO银牌的初代AlphaProof不同,它把大语言模型、AlphaProof和进化算法三合一。其系统架构分为四个层级,从简单到复杂。工作流的核心循环是AI提出证明草稿,Lean编译器验证,失败则反馈错误信息,AI修正后再验证,循环往复,直到证明通过或耗尽算力预算。

9道问题具体情况

DeepMind将完整版Agent D投放到353道已形式化的Erdős问题上,最终攻克9道。如Erdős #12悬置56年,AI结合中国剩余定理和三项等差数列回避集给出解法;Erdős #125,AI证明答案否定,核心是归纳稀疏化论证;Erdős #138,AI给出优雅证明;Erdős #846,AI构造令人叹为观止。目前9道问题的Lean证明代码已开源在GitHub上。

简单Agent也能解全部9题

最出人意料的是,最简单的Agent A也能解决全部9道问题。它没有进化算法和AlphaProof,只有多个独立的LLM子智能体和Lean编译器的反馈循环。Agent A和Agent B表现相近,Agent D在最困难问题上有成本优势。DeepMind将基础Agent的成功归因于LLM能力飙升和编译器反馈的强大作用。

多领域取得突破

除了Erdős问题,AlphaProof Nexus还在多个数学分支取得实质性突破。在OEIS猜想中,系统自动形式化492个开放猜想,证明44个;代数几何中,解决约15年悬置问题;凸优化中,解决关于锚定梯度下降 - 上升算法精确收敛速率问题,还发现新学习率调度参数;图论中,证明Graffiti系统猜想;加法组合学中,解决Ben Green开放问题列表第57题;量子光学中,与Mario Krenn合作解决多个单色量子图猜想。

AI改变数学研究方式

2026年5月,AI在数学领域造诣达到研究级水平。OpenAI走自然语言路线,DeepMind走形式化验证路线。自然语言路线灵活但可能有幻觉,形式化路线可靠但有领域局限。DeepMind的数学家合作者发现,即使智能体无法证明目标定理,其生成的证明尝试也能加深他们对问题的理解。未来,AI先用自然语言探索思路,再用形式化系统验证,人类数学家角色转变。有人说,我们正目睹数学奇点的早期火花。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 22:48:25

从泥泞中走来:一个普通人的十五年

一、2010-2013:那段不愿提起的日子2010年,我去了马鞍山。不是因为工作,不是因为梦想,而是被一个“机会”骗过去的。那是一个叫“1040阳光工程”的传销组织。现在回头看,那段经历像一场醒不来的噩梦。每天听课、洗脑、交…

作者头像 李华
网站建设 2026/5/27 22:46:43

百度飞桨PaddleOCR(1):从官方资源到实战部署的完整指南

1. 认识PaddleOCR:你的全能文字识别助手 第一次接触PaddleOCR时,我完全被它的能力震撼到了。这个由百度飞桨团队开源的OCR工具,不仅能识别常规的印刷体文字,连手写体、竖排文字、甚至复杂背景下的文字都能准确识别。最让我惊喜的是…

作者头像 李华
网站建设 2026/5/27 22:42:01

Windows + Apache + PHP + MySQL 多项目完整手动搭建教程

我现在直接给你一套 100% 能成功、一次复制粘贴就能用的 Windows Apache PHP MySQL 多项目完整手动搭建教程,适配你现在的环境: Apache:32 位 win32 vs18 PHP:8.0.30 Win32 TS 多项目、任意目录映射、独立访问 全程不踩坑、…

作者头像 李华
网站建设 2026/5/27 22:40:58

智能调光反而更伤眼?深入聊聊LED驱动电源与PWM调光背后的频闪陷阱

智能调光背后的视觉健康危机:解码LED频闪与驱动电源的技术博弈当你在深夜的书房调暗智能台灯准备阅读,或是清晨用手机APP将卧室灯光缓缓调亮时,可能不会意识到这些看似人性化的操作正在悄悄挑战着眼睛的生理极限。市场上标榜"护眼"…

作者头像 李华