留给人类数学家的悬赏不多了！谷歌DeepMind一口气解决9道埃尔德什问题

Q: Erdős#12

介绍Erdős#12问题及其解决方案。

量子位

量子位2026年5月26日

留给人类数学家的悬赏不多了！谷歌DeepMind一口气解决9道埃尔德什问题

9.0Score

TL;DR · AI 摘要

谷歌DeepMind的AlphaProof Nexus系统解决了9个长期未解的埃尔德什数学难题，展示了AI在数学领域的强大潜力。

核心要点

谷歌DeepMind的AlphaProof Nexus系统解决了9个长期未解的埃尔德什数学难题。
该系统使用Gemini 3.1 Pro生成Lean语言证明步骤，并通过Lean编译器逐行检查，最终成功验证。
最简单的Agent A也能解出全部9道题，体现了系统的高效性和鲁棒性。

结构提纲

按章节快速跳转。

§引言
介绍谷歌DeepMind的AlphaProof Nexus系统及其在数学领域的应用。
·AlphaProof Nexus的架构
详细描述AlphaProof Nexus的架构和工作流程。
›核心机制
解释Gemini 3.1 Pro如何生成Lean语言证明步骤，并通过Lean编译器进行验证。
·解决的具体问题
列举并分析AlphaProof Nexus解决的9个埃尔德什数学难题。
›Erdős#12
介绍Erdős#12问题及其解决方案。
›Erdős#125
介绍Erdős#125问题及其解决方案。
›Erdős#846
介绍Erdős#846问题及其解决方案。
·系统优势
总结AlphaProof Nexus系统的优点，包括高效性、鲁棒性和低成本。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

AlphaProof Nexus
- 架构
  - Gemini 3.1 Pro生成Lean语言证明步骤
  - Lean编译器逐行检查
- 解决的问题
  - Erdős#12
  - Erdős#125
  - Erdős#846
- 系统优势
  - 高效性
  - 鲁棒性
  - 低成本

金句 / Highlights

值得收藏与分享的关键句。

谷歌DeepMind的AlphaProof Nexus系统解决了9个长期未解的埃尔德什数学难题。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
最简单的Agent A也能解出全部9道题，体现了系统的高效性和鲁棒性。
— 第 12 段
⬇︎ 下载 PNG 𝕏 分享到 X
Gemini 3.1 Pro生成Lean语言证明步骤，并通过Lean编译器逐行检查，最终成功验证。
— 第 7 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI#数学#DeepMind#AlphaProof Nexus#埃尔德什问题

打开原文

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

2026-05-26 16:20:39 来源：量子位

解决卡了人类56年的数学难题

闻乐发自凹非寺
量子位 | 公众号 QbitAI

AI进军数学界的速度太快了。

OpenAI前脚刚用内部模型突破埃尔德什的80年单位距离问题，谷歌DeepMind后脚就解决一个同样卡了人类56年的埃尔德什数学难题——

最新发布AlphaProof Nexus，一套由Gemini驱动的智能体框架，一出手就是9个埃尔德什开放问题

除了这9道，它还顺手证明了OEIS整数序列百科里的44个猜想、搞定了一道搁置15年的代数几何难题、还改进了凸优化领域里一个沿用已久的理论边界。

推理成本呢？每道题几百美元，整套证明代码也全都开源放在了GitHub上。

这篇论文共有20位作者，其中的Aja Huang，也是2016年AlphaGo的核心研究员。

56年没人做出来的题，AI 给了什么答案

AlphaProof Nexus解决的这几道题，咱挑三道最有意思的说说。

Erdős#12，1970年提出，悬置56年

这道题问的是：你能不能找出一个无限大的整数集合，满足两个听起来很别扭的条件：

第一，任意从中挑三个不同的数字a、b、c，a永远不能整除b加c的和。

第二，这组数不能太零散，在自然数里要保持一定的密度。

简单理解就是，这群数字之间，既不能一个数整除另一个数，也不能一个数整除另外两个数的和，同时数字还要分布得相对密集，不能只挑寥寥几个数投机取巧。

从1970年开始，就没人能给出这个集合的完整构造，各种局部进展有，但始终拼不成一个整体解。

AI的解法是用中国剩余定理把大问题拆成许多个独立的区块，每个区块内部用三项等差数列的回避集来满足约束，然后把所有区块拼回一个完整的无限集。

Erdős#125，1996年提出，30年没有定论

这道题听着就更奇怪了。

想象两个数字集合：第一个集合里全是“在三进制下只由数字0和1组成的整数”，第二个集合里全是“在四进制下只由数字0和1组成的整数”。把这两个集合里所有数字两两相加，得到一个新集合。

问：这个新集合里的数字在自然数中出现的频率（数学上叫下密度）是不是正的？

直觉上你可能会觉得，两种集合包含的数字本来就不算很多，加起来应该也挺稀疏的。

但稀疏到什么程度？是彻底稀到密度归零，还是多少保持一点正密度？

这中间的差别非常微妙，1996年提出后一直没定论。

AI的答案是：密度为零。

证明思路是log₄除以log₃是无理数。这意味着3的幂次和4的幂次可以以任意精度彼此逼近。

利用这一点，AI构造了一个归纳性稀疏化论证：不断找到两个几乎对齐的尺度，让密度以0.99的比率一步步衰减，直到彻底归零。

一个纯数论的性质，解决了一个组合几何的问题。

Erdős#846，1992年提出，卡了人类34年。

这是个平面几何题，AI证明了存在这样一个无限扩展的平面点集：

你从中任意挑出有限个点，总能发现其中大部分点是不共线的——

随便截一段，看起来都挺正常，但当你试图把这个无限集合拆分成有限个“绝对没有任何三点共线”的子集时，办不到。

一个集合的每个有限局部都正常，但整体顽固得不可拆分。这种全局与局部的张力，是组合几何里最难的那一类问题。

AI把完全图的每条边映射到平面上一个点，用二次多项式编码坐标，再拉上无穷Ramsey定理完成证明，把一个几何问题翻译成了图论和逻辑的语言。

除了这三道，还有六道分别在整除集构造、范德瓦尔登数间隙、西顿集孤立点、集合拆分密度等领域。

同时，AlphaProof Nexus还在OEIS整数序列百科里证明了44个开放猜想，在代数几何那边解决了一道希尔伯特函数对数凹性的15年悬案，凸优化那边改进了一个锚定梯度下降法的理论边界。

菲尔兹奖得主陶哲轩曾经提醒过，AI目前解决埃尔德什问题的实际成功率大约在1-2%，这次谷歌的系统挑战了353道题，解开9道，比例刚好对上了。

用几百美元算力换一道56年难题

AlphaProof Nexus的架构核心用一句话就能说清楚，Gemini 3.1 Pro生成Lean语言证明步骤→Lean编译器逐行检查→报错直接反馈给模型→模型根据报错修改→再检查→循环到全部通过。

好家伙，这有点像平时写代码，只不过现在Debug的是数学定理……

在这套框架里，DeepMind设计了四个Agent。

最简单的Agent A是同时启动多个独立子Agent，先靠Gemini 3.1 Pro梳理解题思路，动手编写证明代码。

写完立刻交给编译器核验，一旦报错，错误信息就会传回模型，让它不断修改、重试，直到通关。

全程没有额外辅助工具，纯靠写代码+查错循环。

Agent B多了一样东西，AlphaProof。

AlphaProof是DeepMind之前专门为奥数级别题目训练过的强化学习证明工具。

当Agent A模式在某个小步骤上反复卡住、编译器反复报错也修不过来时，Agent B可以调用AlphaProof做一次强化学习驱动的树搜索，专门攻击这个局部难点。

Agent C引入了进化算法的思路。

前面两种Agent的子Agent都是各自独立工作的，互不交流。

Agent C是所有子Agent共享一个证明草图种群，每一个子模块都会产出不同的证明草稿。

然后由另一个模型从合理性、清晰度、新颖性三个维度给每一份草稿打分，用Elo评分系统排名。

高分草稿会相互组合，衍生出新解法，低分草稿直接淘汰，整个种群在证明空间里做进化搜索。

Agent D是全功能完全体，进化筛选思路+专项工具攻克难点+大模型逻辑推理，三股力量在一个框架里协同，也是这次批量破解难题的主力。

这么看下来，我以为最强的Agent D应该会碾压一切，Agent A只当个对照组。

结果没想到论文里表明最简单的Agent A，同样能解出全部9道题。

没有进化算法，没有AlphaProof，就一个LLM循环加编译器反馈的Agent A，只是在难题上更费钱一点。

研究团队把原因归为两个：

一是Gemini 3.1 Pro本身的能力已经足够强了；
二是Lean编译器的那层实打实的纠错反馈，对AI的引导作用，远比人们预想的更大。

这个结果或许也在预示着，未来随着大模型能力持续升级，复杂的多工具组合系统，可能不再是刚需，只用大模型+专业校验工具这套简单循环，就能搞定大多数数学难题。

而且这套方案的优势也体现在成本上，单题仅需几百美元。

埃尔德什生前为这些难题设置了悬赏，只是他不会想到——

解开这些谜题的可能不是人类智慧，而是算力。

论文地址：https://arxiv.org/abs/2605.22763v1

Github地址：https://github.com/google-deepmind/alphaproof-nexus-results

参考链接：

[1]https://x.com/pushmeet/status/2058936037754224998

[2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态