< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

鹭羽 2025-12-13 22:43:25 来源：量子位

“传统方法数周或者数月才能解决”

西风鹭羽发自凹非寺

量子位 | 公众号 QbitAI

刚刚，陶哲轩与多名数学家通力合作，为Erdős#1026正式画上了句号。

至此，这个尘封50年的难题终于得到完全解决。

关键是，AI又立大功了。在多种AI工具的辅助下，整个解题流程仅用48小时便完成。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

博采众家&AI之长，正在成为解决问题的关键。

正如陶哲轩本人所说：

用传统方法，一两位数学家用简单的编程和文献检索工具，最终也能完成，但可能需要数周或者数月才能解决。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

陶哲轩随后亲自梳理并公开了此次问题被解决的完整过程。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

消息传出后，网友纷纷感叹“太酷了”：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

一起来看看他们究竟是如何解决的？

48小时解决Erdős#1026

Erdős#1026问题最早在1975年被提出，初始问题为：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

但该问题表述相当模糊，于是数学家Desmond Weisenberg提议对这个函数的最小可能值进行研究，引入一个最大常数的量c(n)，使得：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

其中c(n)是所有长度为n的不同实数序列。

如果用博弈论来解释该问题，那么就是：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

问Bob无论Alice如何分配硬币，至少能保证拿走全部硬币的多少比例？其中c(n)是Bob拿走的最小比例。

这里陶哲轩还用AI画了一张简单的说明图：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

陶哲轩随即给出了他的初步答案，显然c(1)=1时，Alice只有一堆，Bob可以拿走全部；c(2)=1时，两堆一定处于单调，Bob可以拿两堆；c(3)=2/3时，Bob至少可以取两堆，但无法保证全部三堆。

数学家Stijn Cambie提出了更进一步的猜想。

通过计算c(n)的前几个值可以得到，存在以下近值：1，1，2/3，1/2，1/2，3/7，2/5，3/8，1/3。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

该证明成功将原问题转化为一个计算几何领域的矩形填充问题。

一个小时不到，另一位数学家Koishi Chan加入其中，给出了一个基于原始Erdős–Szekeres定理的替代证明，印证了前面AI的发现。

第二天，陶哲轩注意到了这个问题，他将该问题放入AlphaEvolve，要求它通过生成总和为固定值（这里选择的是10的6次方）的实数（或整数）序列，来获取c(n)的上界，并尽可能确保S的值够小。

在运行一小时后，AlphaEvolve生成了以下c(n)的上界，其中包含了一些结构清晰的潜在极值解：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

显然数值分数（除以10的6次方）正在试图逼近简单有理数，于是陶哲轩又利用John Cook的公开专用工具，将序列整理成：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

这为序列c(n)的值提供了一种猜想，之后Boris Alexeev继续找到了该猜想的简洁表述，即：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

另外，他还提供了一个明确的上界构造：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

该上界通过构造不利配置的序列实现，基本思想仍然来自Erdős–Szekeres定理，即复杂设计数字排列顺序，会使得长单调序列无法同时拥有很好的权重。

这种构造是组合性的，需要精心设计序列结构与分块策略，才能使最长序列单调和受限。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

用ChatGPT Pro生成1/c(n)的图像，能够直观看出，它基本上是对平方根函数的分段线性逼近。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

不久之后，数学家Lawrence Wu就该问题，结合正方形填充（Erdős#106）进行了阐述。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

根据Erdős#106，他将f(n)引入该问题，设定其为最小数，使得把n个正方形按平行坐标轴打包进一个大正方形时，满足：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

其中对于n=10时，用ChatGPT Pro生成转换成方形打包的图像，如图所示：

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

在此基础上，Lawrence Wu通过AI论文检索，找到了一篇去年由Baek、Koizumi和Ueoro联合发表的论文，最终证明了猜想中的公式，从而完成了整体证明。

接下来陶哲轩将上述所有信息全部输入了ChatGPT，生成了连贯证明。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

视频链接：https://mp.weixin.qq.com/s/60SqsE0hcV-3gwxsQfA6jw

人+人+AI=数学破壁机

当然，这已经不是陶哲轩第一次用AI解题了。

最近，他还借助Gemini 2.5 Deep Think破解了Erdős问题#367。

这是他本人很擅长的连续整数结构的乘法数论问题，该问题建立在前人并不完整的反证基础上，陶哲轩借助Gemini Deep Think进行证明补全。

全程只用了十分钟，Gemini就从论证分析打通了结论确认。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

另外，陶哲轩前段时间还利用GPT-5进行半自动化文献检索。

他借助GPT-5对相关数列进行高精度计算，随后将得到的结果输入OEIS（一个收录全球数列的数据库）进行检索对照，进而发现部分Erdős问题其实早已在既有研究中被解决——只是长期没人注意到，未把结果与问题库对应起来。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

至于什么是Erdős问题？

它出自20世纪著名匈牙利数学家Paul Erdős。此人一辈子合作了超500位数学家，毕生发表了约1525篇数学论文，数量之多，至今无人能及。相应地，他也提出或转述了千道问题，给后人留下了“Erdős问题”。

其中大量题目被收录于erdosproblems.com网站。该网站由数学家Thomas Bloom制作，记录了每道题目的当前状态。目前，绝大多数难题依然悬而未解。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

随着AI技术的不断进步，接连有人利用AI成功解答了这些几十年来未曾解决的难题。

陶哲轩本人就表示，“在Erdős问题网站上，AI辅助已经变得很常见”。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

就在前几天，来自Harmonic的数学AI模型还被曝独立证明了Erdős问题#124。

微软前AI副总裁、目前在OpenAI研究AGI的Sebastien Bubeck表示“该解决方案100%由AI生成，总计耗时6小时”。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

目前，Erdős网站也公开鼓励大家借助AI等工具辅助解题：

允许使用AI辅助撰写评论，但需满足：(a)公开说明使用了AI；(b) 内容（包括数学内容、代码、数值数据及相关来源）已由用户本人独立（不借助AI）仔细检查和验证；(c)评论长度合理。

半世纪难题48小时破解！陶哲轩组队把AI数学玩成打怪游戏了

而这次Erdős#1026的快速解决，离不开“人与人的协作”+“人与AI的协作”。

这种协作方式，也正在成为一种新趋势。

参考链接：
[1]https://www.erdosproblems.com/forum/thread/1026
[2]https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/

版权所有，未经授权不得以任何形式转载及使用，违者必究。

数学陶哲轩

Opus 5游戏提示词爆火！24小时复刻3A巨作2026-07-29
全球首个Agentic扩散模型来了：边行动边纠错，128K上下文追平自回归2026-07-28
菲尔兹奖得主王虹，也发过NeurIPS2026-07-24
小红书大模型IMO满分夺金，第三题解法让冠军选手直呼优雅2026-07-22

相关阅读

阿里数学竞赛最年轻金奖得主：17岁北大读大二，小学就看数学分析

阿赛五年已走出十余位数学家

白交2023-09-16

数学阿里阿里巴巴全球数学竞赛

不学数学就当厨子，兰大校友入选全球竞赛10强，最后几小时才做题

本科才打开高数的大门

梦晨2022-10-07

兰州大学数学阿里数学竞赛

素数分布规律又有新发现！赵宇飞学生与牛津教授合作成果

Gowers范数的又一新应用

克雷西2024-12-22

数学

17个改变世界的数学公式，马斯克点赞

你pick哪一个？

十三2022-03-09

公式数学马斯克

陶哲轩用GPT5-Pro跨界挑战！3年无解的难题，11分钟出完整证明

总结“AI在小尺度有用、中尺度无益、大尺度又有帮助”

鹭羽2025-10-11

数学陶哲轩

陶哲轩：张益唐新论文存在一些技术问题，我已请他澄清

“不想给益唐压力，建议大家也耐心等待”

梦晨2022-11-17

张益唐数学陶哲轩

热门文章

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

智能体政策新闻相关背景和简要解读

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里

长内容创作者苦AI失忆久矣，这个新Agent漂亮填坑！门槛低到只需要会用键盘打字