news 2026/5/31 12:55:25

OpenAI 内部模型自主破解 80 年数学猜想:AI 科学推理的“GPT 时刻“

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 内部模型自主破解 80 年数学猜想:AI 科学推理的“GPT 时刻“

2026年5月20日,OpenAI 发布了一则震动数学界和 AI 界的消息:其内部推理模型自主证明(严格说是"推翻")了离散几何学中悬宕约80年的 Erdős 单位距离猜想,证明经外部数学家小组验证,被认为达到顶级数学期刊的发表标准。

这不是"AI 辅助人类证明",而是一个通用推理模型——没有经过数学专项训练、没有针对该问题的脚手架——独立产生了一个包含原创性思想、可被验证的完整证明

菲尔兹奖得主 Tim Gowers 评价:"这是 AI 数学的里程碑。如果人类写了这篇论文投给《数学年刊》,我会毫不犹豫地推荐接收。"

一个"简单"到极致的难题

故事要从1946年说起。

匈牙利传奇数学家 Paul Erdős 提出了一个看起来人畜无害的问题:在平面上放置 n 个点,最多能有多少对点之间的距离恰好为 1?

用数学语言描述:令 u(n) 为平面上 n 个点之间单位距离对的最大数量。Erdős 本人给出了一个下界构造——把点放在正方形网格上,缩放后大约能得到 n^(1 + c/log log n) 个单位距离对。这个构造的增长速度仅比线性略快。

几十年来,数学界普遍相信这就是最优解——你不可能做得比正方形网格好太多。Erdős 本人也猜想上界是 n^(1+o(1)),即任何额外增长都会随着 n 增大而趋于零。

这个猜想成为了离散几何领域的"圣杯"级问题。Brass、Moser 和 Pach 在2005年的经典著作《离散几何中的研究问题》中将其列为"可能是组合几何中最著名(且最容易解释)的问题"。

80年来,无数数学家尝试过,没人能撼动它。

AI 做了一件"没人想到"的事

OpenAI 的推理模型给出的答案让所有人意外:猜想是错的。

模型构造了无限族反例,对于无限多个 n 值,存在点配置能产生至少 n^(1+δ) 个单位距离对,其中 δ > 0 是一个固定的正指数。换句话说,你确实能比正方形网格做得更好,而且好出一个多项式级别的差距。

更令人震惊的是证明方法。Erdős 原来的构造基于高斯整数(形如 a+bi 的数),而新证明使用了代数数论中的深度工具——无穷类域塔(infinite class field towers)和 Golod-Shafarevich 理论。

一个几何问题,最终被代数数论中的抽象概念解决。这种跨领域的"远距离联想"正是人类顶尖数学家引以为傲的创造性思维。

普林斯顿数学教授 Noga Alon 的评价很有代表性:

"这是 Erdős 最喜欢的问题之一,我亲耳听他在讲座中多次提到。组合几何领域的每位数学家都思考过它……AI 内部模型解决这个问题是一项杰出成就。正确答案不是 n^(1+o(1)) 的事实令人惊讶,其构造和分析以优雅而聪明的方式应用了代数数论中相当复杂的工具。"

模型的"思考过程"透露了什么

OpenAI 公开了模型链式推理(Chain of Thought)的删节版。最引人注目的是:模型的大部分思考都在尝试构造反例,而非试图证明猜想成立。

多伦多大学教授 Arul Shankar 对此印象深刻:

"模型的 CoT 非常有趣。值得注意的是,绝大多数思考都在试图构造一个反例来推翻广泛相信的上界,而不是试图证明它。这说明模型具备某种组合——良好的直觉、愿意尝试被学界视为'大概率失败'的路径,以及尝试构造的倾向。"

换句话说,模型不是通过暴力搜索找到答案的,而是像一位有经验的研究者一样,凭直觉选择了正确的攻击方向,然后坚持不懈地构造反例,直到成功。

Tim Gowers 进一步写道:"在我看来,这篇论文证明当前的 AI 模型不仅能作为人类数学家的辅助工具——它们有能力产生原创的、巧妙的想法,并将这些想法贯彻到底。"

从"AI 辅助"到"AI 原创"

这个突破的关键区别在于自主性。

过去几年,AI 在数学领域已有不少亮眼表现——辅助证明、模式发现、反例搜索。但这些都是"AI 辅助人类"的模式:人类数学家定义问题、设计框架,AI 在子任务上提供帮助。

Erdős 猜想的证明不同:一个通用推理模型,面对一个完全开放的问题,自主完成了从直觉判断、路径选择、构造尝试到完整证明的全过程。人类数学家没有告诉它"去试试代数数论",是模型自己找到了这个出人意料的连接。

Nature、Science、Scientific American、The Guardian 等顶级媒体都对此进行了报道。Nature 的文章标题直截了当:《AI 破解了80年数学难题》。

对开发者的启示:推理能力正在质变

这个事件对 AI 开发者有几个重要信号:

1. 通用推理模型的能力边界远超预期

OpenAI 强调,这个模型不是为数学定制的。它是一个通用推理模型,只是在测试"高级模型能否为前沿研究做贡献"时,偶然解决了这个开放问题。这意味着同样的推理能力可以迁移到代码生成、系统设计、科学计算等领域。

2. "远距离联想"是 AI 的下一个突破口

模型将代数数论与离散几何连接起来的能力,本质上是一种跨领域知识迁移。这对 RAG 系统设计、知识图谱构建、Agent 工具选择等工程问题有直接启示——如何让 AI 在不同知识域之间建立"意外但正确"的连接。

3. 验证比生成更难

OpenAI 邀请了外部数学家小组验证证明,这个过程花了数周。对于开发者来说,这是一个关键提醒:AI 可以生成越来越复杂的输出,但验证这些输出的正确性需要同等的专业能力。在工程实践中,这意味着我们需要更好的测试框架、更强的静态分析工具、更完善的验证流程。

结语:科学研究的"Copilot 时刻"

OpenAI 在官方博客中写道:"AI 即将在研究的创造性部分扮演非常严肃的角色,最重要的是 AI 研究本身。"

这句话的分量值得细品。如果一个 AI 模型能够独立解决数学领域80年的开放问题,那么它在代码审查、架构设计、性能优化等方面的潜力会有多大?

正如 Thomas Bloom 在配套论文中所说:"AI 正在帮助我们更充分地探索我们几个世纪以来建造的数学大教堂——还有哪些看不见的奇迹在等待?"

数学是推理能力的试金石。当 AI 开始在试金石上留下自己的名字时,我们正在见证的,可能不只是数学的新篇章,而是科学发现范式的根本转变。


参考文献:- OpenAI. "An OpenAI model has disproved a central conjecture in discrete geometry." May 20, 2026. - Scientific American. "AI just solved an 80-year-old 'Erdős problem,' and mathematicians are amazed." May 2026. - Nature. "AI cracks 80-year-old mathematics challenge." May 2026. - The Guardian. "OpenAI makes breakthrough on 80-year-old maths problem." May 21, 2026.

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/31 12:55:25

抖音素材收集终极指南:5步实现批量无水印下载

抖音素材收集终极指南:5步实现批量无水印下载 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖音…

作者头像 李华
网站建设 2026/5/31 12:55:25

基于ESP32与Blynk的分布式智能家居系统:低成本实现网络/本地双控

1. 项目概述与核心价值想自己动手搭建一套覆盖全屋、能远程控制又能本地操作的智能家居系统,但又觉得市面上的成品要么太贵、要么不够灵活?如果你手头有几块ESP32或者NodeMCU开发板,再配上一些基础的电子元件,这个想法完全可以在一…

作者头像 李华
网站建设 2026/5/31 12:54:22

揭秘RevokeMsgPatcher:微信QQ防撤回完整操作指南

揭秘RevokeMsgPatcher:微信QQ防撤回完整操作指南 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: https://gitcode.com/Git…

作者头像 李华
网站建设 2026/5/31 12:47:06

基于Arduino与LM339的12V PWM信号发生器设计与实现

1. 项目概述与核心价值在汽车电子和工业控制领域,12V直流电源是标准的工作电压,而PWM(脉宽调制)信号则是控制风扇、水泵、电机等执行器速度和功率的核心手段。很多时候,我们手头有一个需要12V PWM信号驱动的设备&#…

作者头像 李华