菲尔兹奖得主实测:ChatGPT 5.5 Pro 17分钟生成数学论文深度测评
摘要
数学界正面临一场静悄悄的风暴。最近,菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)在亲
数学界正面临一场静悄悄的风暴。最近,菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)在亲身体验了ChatGPT 5.5 Pro后,为数学专业的学生,尤其是博士生,拉响了警报。
这位剑桥大学的数学大师,在拿到新模型后,随手将几道加法数论的公开难题抛给了AI。接下来的发展,完全超出了他的预料。
如果AI的数学水平继续按目前速度发展,我们(数学研究者)很快会面临一场危机。
不到两个小时,AI独立完成了一项他认为“完全够格写进博士论文”的数学成果。整个过程,高尔斯教授没有提供任何数学层面的指导,他所做的仅仅是像项目经理一样提出需求、确认方向、要求交付。数学本身,全部由ChatGPT完成。
这一刻,高尔斯真切感受到了年轻一代可能面临的窒息感。当AI已经能独立攻克这种水平的难题,正在攻读博士学位的年轻数学家们,未来的路在哪里?连他都给不出清晰的答案。唯一能做的,就是尽快为学生们寻找新的出路,在通用人工智能真正到来之前,重新锚定数学学习的核心价值。
对学生负有责任的数学系,应该紧急为此做好准备。
不过,另一位菲尔兹奖得主陶哲轩,对此则有更多话要说。作为长期活跃在AI与数学交叉领域的先锋,他最近联合创立了AI4S组织,旨在帮助年轻人寻找AI时代的新出路。他最新的感悟是:数学证明的“消化”问题,才是AI时代人类数学家最不可替代的价值所在。
两位当世顶尖的数学家,面对同一场技术风暴,给出了不同角度的深刻思考。
一场碘伏预期的数学实验
故事的起点,是一篇关于加法数论的论文。数学家梅尔·纳坦松(Mel Nathanson)在文中列举了一系列关于整数集合求和性质的公开问题。这类问题方向明确、难度适中、数量又多,历来是博士生入门、冲击首篇顶刊的绝佳练手材料。
高尔斯教授正是将这些问题丢给了ChatGPT 5.5 Pro。其中一个典型问题是:给定一个包含k个元素的整数集合A,已知其二重求和集(即集合内所有元素两两相加得到的新集合)的大小,那么集合A的“直径”(即最大元素与最小元素之差)最小可能是多少?
纳坦松本人已经证明了一个指数级的上界,但他一直怀疑这个结果可以优化。
ChatGPT 5.5 Pro思考了17分零5秒,给出了一个二次上界的构造,并且这个构造在理论上是“最优”的。它的核心思路是巧妙地组合使用西顿集(Sidon set,一种能使求和集规模最大化的特殊集合)和等差数列。
通俗地讲,就像搭积木。纳坦松的证明本质上也用了组合构造,但他使用的是效率较低的“2的幂次”这类西顿集,好比用大积木搭小房子,难免浪费空间,导致直径呈指数级增长。而AI则直接选用了已知的更高效的西顿集,其直径是二次的(即k²级别),空间利用率大幅提升。
关键在于,纳坦森本人没有想到这一步,而AI想到了。随后,高尔斯又提出了一个相关的升级版问题,同样被AI迅速解决。他接着让AI将两个结果合并,撰写成标准的LaTeX预印本,整个过程仅用了47分钟。
实验并未止步。高尔斯进一步挑战了更一般的k重求和集直径问题。这个问题要困难得多,因为对于一般的k,学界甚至不完全清楚哪些求和集大小是可以实现的。
麻省理工学院的学生艾萨克·拉贾戈帕尔(Isaac Rajagopal)曾在此问题上做出开创性工作。高尔斯想看看AI能否在此基础上改进。结果,AI上演了“两连跳”:它先是基于“解离集合”的创新思路,将上界从指数级改进到了亚指数级;随后,在高尔斯的追问下,它又通过微调“k-解离集合”构造,尝试冲击多项式界,并自行验证了关键的技术细节。
整个过程中,AI不仅贡献了严谨的论证,更贡献了新的想法。而高尔斯所做的,仅仅是提出问题、确认方向和要求交付。
被抬高的门槛与釜底抽薪的危机
如果这只是一个酷炫的技术演示,或许还不足以引发深层次的忧虑。但高尔斯从中看到了两个迫在眉睫的危机。
首先是一个现实问题:AI完成的数学成果,该如何处理?以人类标准,这完全够资格发表。然而,当前的主流学术预印本平台arXiv已明确拒绝AI生成内容,传统期刊的态度也可想而知。那么,这些成果该归于何处?高尔斯设想,或许需要建立一个专门的AI数学成果仓库,并辅以一定的审核机制,但这本身又会带来新的挑战。
比成果归属更根本的,是数学人才培养体系正面临釜底抽薪的冲击。训练博士生做研究的经典路径,就是给他们一个难度适中的公开问题作为起点。纳坦松论文中的那些问题,原本就是完美的“新手村”任务。但现在,ChatGPT 5.5 Pro在几小时内就能解决。这意味着,入门门槛被无形中大幅抬高:以前,你只需要证明一个“没人证明过”的东西;现在,你可能需要证明一个“AI也证明不了”的东西。
高尔斯并未完全陷入悲观,他指出了两个可能的缓冲地带。
其一,博士生同样可以使用AI。未来的科研门槛,或许不再是硬刚“AI解不出的题”,而是在人机协作中,做出AI单独无法完成的成果。高尔斯本人近期就在大量进行此类协作研究,他认为AI能提供有价值的贡献,但尚未达到能独立产生碘伏性想法的程度。
其二,AI目前最容易突破的领域是组合数学。因为组合学更多是从问题出发进行反向推理,而其他数学分支(如分析、代数几何)则更依赖于从想法出发的正向探索和审美判断,后者对AI而言可能更具挑战性。
但他也特别强调,这些判断仅基于当前AI的水平,大模型的迭代速度极快,现状可能几个月后就会改变。他甚至尖锐地指出:如果一个人从事数学研究的目的,是将自己的名字永远刻在某个定理或定义上,追求“冠名永生”,那么这种时代红利可能很快就会彻底消失,对所有人都一样。
通过一个思想实验,高尔斯点透了本质:假设一位数学家通过与AI长时间对话解决了一个重大问题,数学家起了引导作用,但核心想法和全部技术工作均由AI完成,我们会认为这是这位数学家的重大成就吗?他的答案是:不会。
那么,AI时代学习数学的意义何在?高尔斯的观点是,数学训练所沉淀的是一种高度可迁移的底层思维能力。就像优秀的程序员更擅长“氛围编程”(Vibe coding)一样,真正做过研究的数学家,也更擅长与AI进行有效协作。你对问题解决过程的理解越深,驾驭AI的能力就越强。未来,数学研究者或许会失去独享定理冠名的学术荣誉,但那份锤炼出的思维功底,将成为AI时代最坚实的个人底气。
陶哲轩的“消化”金字塔
关于AI对数学研究的冲击,陶哲轩看得更早,也思考得更深。他提出了一个解决问题的“三层金字塔”模型:
- 证明生成:构造出一个完整的证明。
- 证明验证:确认这个证明是正确的。
- 证明消化:真正理解这个证明在说什么,为什么是对的,它揭示了什么更深层次的结构。
前两层——生成与验证——AI正在以惊人的速度实现自动化。但第三层“消化”,远未被解决。这将导致一种前所未有的“认知过载”:证明被大量、快速地生成,甚至机器都能帮你验算完毕,但没有人真正“消化”它们。陶哲轩称之为“证明消化不良”。
有人可能会提议:那就把第三步也自动化,训练AI用更优的写作风格呈现证明,让它更容易被理解。但陶哲轩警告,盲目优化“可读性”指标,可能适得其反。
他用烹饪来类比:我们咀嚼食物,是为了帮助消化。烹饪技术可以让食物更嫩,减少咀嚼的需要。但如果你决定彻底优化消化过程,将“需要咀嚼的量”降到最低,那么逻辑上的最优解就是把所有食物丢进搅拌机,通过管子直接灌进胃里。这在技术上解决了消化问题,但没人想这样吃饭。
吃饭的价值从来不只是摄入营养。感官体验、社交场景、咀嚼本身带来的满足感……这些“附加产物”才是人类享受的部分。优化掉所有“摩擦”,你得到的不是更好的饮食,而是一根饲料管。
数学学习同理。关键在于分清什么是“必须”经历的摩擦。有些证明中的“难度”是人为制造的,比如措辞不清、结构混乱,这些“人工难度”可以被AI工具消除。但还有一种“自然难度”,它本身就应该是难的。读者需要亲自“咀嚼”、煎熬地探索,才能真正理解,并在此过程中迸发新的灵感。这就像陶哲轩曾提到的,他会在日程中特意留出空白,用于“不期而遇”的思考。
试图将所有问题都视为可无限迭代的“优化问题”是危险的。人类对待食物的思路就不是这样。米其林大厨的手工料理,至今仍比机器加工的食品更受珍视,尽管后者可能更安全、美观、易消化、方便且口味不差。加工食品自有其用处,但没人会认真提议用它完全取代人类的烹饪艺术。那份“烟火气”,必须由人类来赋予。
守住“咀嚼”的权利
两位菲尔兹奖得主,从同一场风暴中看到了不同的景象。
高尔斯看到的是危机。那些为年轻学者铺设的传统路径正在被技术碾平,培养体系的地基在动摇,学术发表的规则面临失效。新人的道路在何方?
陶哲轩给出的,则是边界。AI能生成证明,能验证证明,但“消化”这件事,至少在可预见的未来,依然独属于人类。这不是因为AI绝对做不到,而是因为我们不能交出去。“消化”触及智能的本质,关乎意义本身。
这真是一个属于“意义”追问的时代。AI正一步步将我们逼到墙角,迫使我们一次又一次地追问:到底什么才是独属于人类的、最珍贵的东西?
在数学领域,答案或许是陶哲轩所说的那种有益的“自然难度”,是那些必须亲自咀嚼、在煎熬探索中才能真正内化的知识。推而广之,其他领域或许同样如此。
搅拌机可以把一切打碎、混合、高效输送。但有些东西,永远需要人亲自去经历、去体会、去“咀嚼”。
不要沦为插着管子的生物电池,永远不要放弃“咀嚼”的权利。
参考链接:
[1]https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
[2]https://x.com/wtgowers/status/2052830948685676605
[3]https://mathstodon.xyz/@tao/116551624228986501
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。