图灵奖得主萨顿谈生成式AI:科学发现的关键瓶颈
摘要
图灵奖得主理查德·萨顿指出,普通生成式AI缺乏自我评估与持续筛选能力,难以实现真正
6月2日,科技媒体The Decoder发布报道:图灵奖得主理查德·萨顿(Richard Sutton)针对普通生成式AI在科学发现中的局限性提出了直接批评。他的核心论断清晰——这类AI缺少自我评估与持续筛选的机制。

先交代背景:萨顿是美国计算机科学家,强化学习领域的奠基人之一。目前他是阿尔伯塔大学计算机科学教授、北京大学图灵导师,曾任DeepMind研究科学家。2025年3月,他与安德鲁·巴托共同获得2024年图灵奖。
萨顿的观点直截了当:普通生成式AI缺乏真正科学发现所必需的关键能力。大语言模型、图像模型和视频模型确实能从海量样本中学习并生成相似内容——但真正有突破性的输出,往往源于训练数据本身。当模型产生真正新颖的内容时,它已经偏离了原始材料。更棘手的是,面对事实性验证,这类“新颖内容”常被贴上“幻觉”标签。萨顿引用研究者的调侃总结了这一悖论:好的部分不新,新颖的部分不好。
当然,他并未否定生成式AI的实用性。在摘要生成、研究辅助、对话助手和娱乐场景中,这些模型表现稳健。如果你的目标是更快、更便宜、更小、更可定制地复现原有模式,生成式AI确实能带来可量化的价值。
但科学发现不能止步于模仿。真正的发现包含三个关键环节:变异、评估、选择性保留。系统必须生成不同选项,对它们进行测试,然后保留有效策略。事实上,这正是进化、科学方法、规划、搜索和强化学习共同遵循的逻辑。
问题核心在哪?普通生成式AI最缺失的就是评估环节。语言和图像模型能生成海量变体,但缺乏测试机制,无法筛选出更优方案。对比之下,人类可以利用图片分类、棋局胜率、形式化证明、程序测试和模拟奖励等作为有效反馈信号。
萨顿列举了几个值得关注的系统:AlphaGo(阿尔法围棋)、AlphaZero、AlphaFold、AlphaProof、Claude Code和GT-Sophy。这些系统的共同特征在于,它们都拥有超越文本或图像生成的评估闭环。正因如此,它们能够追踪更优解,而非仅仅产出候选答案。
最后,他对AI行业的部分风向提出批评——当前行业过度押注于规模更大的语言模型。相比之下,他更看重能长期与环境互动、从经验中学习、构建世界模型并规划策略的AI智能体。这才是他眼中更有前景的方向。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。