技术资讯菲尔兹奖得主实测

菲尔兹奖得主实测：ChatGPT 5.5 Pro 17分钟生成数学论文深度测评

2026-05-14

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

数学界正面临一场静悄悄的风暴。最近，菲尔兹奖得主蒂莫西·高尔斯（Timothy Gowers）在亲

数学界正面临一场静悄悄的风暴。最近，菲尔兹奖得主蒂莫西·高尔斯（Timothy Gowers）在亲身体验了ChatGPT 5.5 Pro后，为数学专业的学生，尤其是博士生，拉响了警报。

这位剑桥大学的数学大师，在拿到新模型后，随手将几道加法数论的公开难题抛给了AI。接下来的发展，完全超出了他的预料。

如果AI的数学水平继续按目前速度发展，我们（数学研究者）很快会面临一场危机。

不到两个小时，AI独立完成了一项他认为“完全够格写进博士论文”的数学成果。整个过程，高尔斯教授没有提供任何数学层面的指导，他所做的仅仅是像项目经理一样提出需求、确认方向、要求交付。数学本身，全部由ChatGPT完成。

数学专业，危！菲尔兹奖得主亲测ChatGPT 5.5 Pro，17分钟出论文级成果

这一刻，高尔斯真切感受到了年轻一代可能面临的窒息感。当AI已经能独立攻克这种水平的难题，正在攻读博士学位的年轻数学家们，未来的路在哪里？连他都给不出清晰的答案。唯一能做的，就是尽快为学生们寻找新的出路，在通用人工智能真正到来之前，重新锚定数学学习的核心价值。

对学生负有责任的数学系，应该紧急为此做好准备。

不过，另一位菲尔兹奖得主陶哲轩，对此则有更多话要说。作为长期活跃在AI与数学交叉领域的先锋，他最近联合创立了AI4S组织，旨在帮助年轻人寻找AI时代的新出路。他最新的感悟是：数学证明的“消化”问题，才是AI时代人类数学家最不可替代的价值所在。

两位当世顶尖的数学家，面对同一场技术风暴，给出了不同角度的深刻思考。

一场碘伏预期的数学实验

故事的起点，是一篇关于加法数论的论文。数学家梅尔·纳坦松（Mel Nathanson）在文中列举了一系列关于整数集合求和性质的公开问题。这类问题方向明确、难度适中、数量又多，历来是博士生入门、冲击首篇顶刊的绝佳练手材料。

高尔斯教授正是将这些问题丢给了ChatGPT 5.5 Pro。其中一个典型问题是：给定一个包含k个元素的整数集合A，已知其二重求和集（即集合内所有元素两两相加得到的新集合）的大小，那么集合A的“直径”（即最大元素与最小元素之差）最小可能是多少？

纳坦松本人已经证明了一个指数级的上界，但他一直怀疑这个结果可以优化。

ChatGPT 5.5 Pro思考了17分零5秒，给出了一个二次上界的构造，并且这个构造在理论上是“最优”的。它的核心思路是巧妙地组合使用西顿集（Sidon set，一种能使求和集规模最大化的特殊集合）和等差数列。

通俗地讲，就像搭积木。纳坦松的证明本质上也用了组合构造，但他使用的是效率较低的“2的幂次”这类西顿集，好比用大积木搭小房子，难免浪费空间，导致直径呈指数级增长。而AI则直接选用了已知的更高效的西顿集，其直径是二次的（即k²级别），空间利用率大幅提升。

关键在于，纳坦森本人没有想到这一步，而AI想到了。随后，高尔斯又提出了一个相关的升级版问题，同样被AI迅速解决。他接着让AI将两个结果合并，撰写成标准的LaTeX预印本，整个过程仅用了47分钟。

实验并未止步。高尔斯进一步挑战了更一般的k重求和集直径问题。这个问题要困难得多，因为对于一般的k，学界甚至不完全清楚哪些求和集大小是可以实现的。

麻省理工学院的学生艾萨克·拉贾戈帕尔（Isaac Rajagopal）曾在此问题上做出开创性工作。高尔斯想看看AI能否在此基础上改进。结果，AI上演了“两连跳”：它先是基于“解离集合”的创新思路，将上界从指数级改进到了亚指数级；随后，在高尔斯的追问下，它又通过微调“k-解离集合”构造，尝试冲击多项式界，并自行验证了关键的技术细节。

整个过程中，AI不仅贡献了严谨的论证，更贡献了新的想法。而高尔斯所做的，仅仅是提出问题、确认方向和要求交付。

被抬高的门槛与釜底抽薪的危机

如果这只是一个酷炫的技术演示，或许还不足以引发深层次的忧虑。但高尔斯从中看到了两个迫在眉睫的危机。

首先是一个现实问题：AI完成的数学成果，该如何处理？以人类标准，这完全够资格发表。然而，当前的主流学术预印本平台arXiv已明确拒绝AI生成内容，传统期刊的态度也可想而知。那么，这些成果该归于何处？高尔斯设想，或许需要建立一个专门的AI数学成果仓库，并辅以一定的审核机制，但这本身又会带来新的挑战。

比成果归属更根本的，是数学人才培养体系正面临釜底抽薪的冲击。训练博士生做研究的经典路径，就是给他们一个难度适中的公开问题作为起点。纳坦松论文中的那些问题，原本就是完美的“新手村”任务。但现在，ChatGPT 5.5 Pro在几小时内就能解决。这意味着，入门门槛被无形中大幅抬高：以前，你只需要证明一个“没人证明过”的东西；现在，你可能需要证明一个“AI也证明不了”的东西。

高尔斯并未完全陷入悲观，他指出了两个可能的缓冲地带。

其一，博士生同样可以使用AI。未来的科研门槛，或许不再是硬刚“AI解不出的题”，而是在人机协作中，做出AI单独无法完成的成果。高尔斯本人近期就在大量进行此类协作研究，他认为AI能提供有价值的贡献，但尚未达到能独立产生碘伏性想法的程度。

其二，AI目前最容易突破的领域是组合数学。因为组合学更多是从问题出发进行反向推理，而其他数学分支（如分析、代数几何）则更依赖于从想法出发的正向探索和审美判断，后者对AI而言可能更具挑战性。

但他也特别强调，这些判断仅基于当前AI的水平，大模型的迭代速度极快，现状可能几个月后就会改变。他甚至尖锐地指出：如果一个人从事数学研究的目的，是将自己的名字永远刻在某个定理或定义上，追求“冠名永生”，那么这种时代红利可能很快就会彻底消失，对所有人都一样。

通过一个思想实验，高尔斯点透了本质：假设一位数学家通过与AI长时间对话解决了一个重大问题，数学家起了引导作用，但核心想法和全部技术工作均由AI完成，我们会认为这是这位数学家的重大成就吗？他的答案是：不会。

那么，AI时代学习数学的意义何在？高尔斯的观点是，数学训练所沉淀的是一种高度可迁移的底层思维能力。就像优秀的程序员更擅长“氛围编程”（Vibe coding）一样，真正做过研究的数学家，也更擅长与AI进行有效协作。你对问题解决过程的理解越深，驾驭AI的能力就越强。未来，数学研究者或许会失去独享定理冠名的学术荣誉，但那份锤炼出的思维功底，将成为AI时代最坚实的个人底气。

陶哲轩的“消化”金字塔

关于AI对数学研究的冲击，陶哲轩看得更早，也思考得更深。他提出了一个解决问题的“三层金字塔”模型：

证明生成：构造出一个完整的证明。
证明验证：确认这个证明是正确的。
证明消化：真正理解这个证明在说什么，为什么是对的，它揭示了什么更深层次的结构。

前两层——生成与验证——AI正在以惊人的速度实现自动化。但第三层“消化”，远未被解决。这将导致一种前所未有的“认知过载”：证明被大量、快速地生成，甚至机器都能帮你验算完毕，但没有人真正“消化”它们。陶哲轩称之为“证明消化不良”。

有人可能会提议：那就把第三步也自动化，训练AI用更优的写作风格呈现证明，让它更容易被理解。但陶哲轩警告，盲目优化“可读性”指标，可能适得其反。

他用烹饪来类比：我们咀嚼食物，是为了帮助消化。烹饪技术可以让食物更嫩，减少咀嚼的需要。但如果你决定彻底优化消化过程，将“需要咀嚼的量”降到最低，那么逻辑上的最优解就是把所有食物丢进搅拌机，通过管子直接灌进胃里。这在技术上解决了消化问题，但没人想这样吃饭。

吃饭的价值从来不只是摄入营养。感官体验、社交场景、咀嚼本身带来的满足感……这些“附加产物”才是人类享受的部分。优化掉所有“摩擦”，你得到的不是更好的饮食，而是一根饲料管。

数学学习同理。关键在于分清什么是“必须”经历的摩擦。有些证明中的“难度”是人为制造的，比如措辞不清、结构混乱，这些“人工难度”可以被AI工具消除。但还有一种“自然难度”，它本身就应该是难的。读者需要亲自“咀嚼”、煎熬地探索，才能真正理解，并在此过程中迸发新的灵感。这就像陶哲轩曾提到的，他会在日程中特意留出空白，用于“不期而遇”的思考。

试图将所有问题都视为可无限迭代的“优化问题”是危险的。人类对待食物的思路就不是这样。米其林大厨的手工料理，至今仍比机器加工的食品更受珍视，尽管后者可能更安全、美观、易消化、方便且口味不差。加工食品自有其用处，但没人会认真提议用它完全取代人类的烹饪艺术。那份“烟火气”，必须由人类来赋予。

守住“咀嚼”的权利

两位菲尔兹奖得主，从同一场风暴中看到了不同的景象。

高尔斯看到的是危机。那些为年轻学者铺设的传统路径正在被技术碾平，培养体系的地基在动摇，学术发表的规则面临失效。新人的道路在何方？

陶哲轩给出的，则是边界。AI能生成证明，能验证证明，但“消化”这件事，至少在可预见的未来，依然独属于人类。这不是因为AI绝对做不到，而是因为我们不能交出去。“消化”触及智能的本质，关乎意义本身。

这真是一个属于“意义”追问的时代。AI正一步步将我们逼到墙角，迫使我们一次又一次地追问：到底什么才是独属于人类的、最珍贵的东西？

在数学领域，答案或许是陶哲轩所说的那种有益的“自然难度”，是那些必须亲自咀嚼、在煎熬探索中才能真正内化的知识。推而广之，其他领域或许同样如此。

搅拌机可以把一切打碎、混合、高效输送。但有些东西，永远需要人亲自去经历、去体会、去“咀嚼”。

不要沦为插着管子的生物电池，永远不要放弃“咀嚼”的权利。

参考链接：
[1]https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
[2]https://x.com/wtgowers/status/2052830948685676605
[3]https://mathstodon.xyz/@tao/116551624228986501

来源：互联网

上一篇 芒果AI视频战略合作解析：爱诗科技如何赋能内容生态升级 下一篇 城市算力竞争指南：抢占Token驱动的新赛道

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

菲尔兹奖得主实测：ChatGPT 5.5 Pro 17分钟生成数学论文深度测评

摘要

一场碘伏预期的数学实验

被抬高的门槛与釜底抽薪的危机

陶哲轩的“消化”金字塔

守住“咀嚼”的权利

相关文章推荐