菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > 2028年前AI自主进化概率达60%:Anthropic联创深度解析行业变革与未来排行榜
产业资讯 Anthropic

2028年前AI自主进化概率达60%:Anthropic联创深度解析行业变革与未来排行榜

2026-05-07
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

Anthropic联合创始人预测,递归自我改进有60%概率在2028年底前发生。AI能力进展迅速,处理任

AI系统自主构建自身的时代,可能比预期更早到来。

这一判断来自Anthropic联合创始人杰克·克拉克。5月4日,他在社交平台X上发布了一项关键预测:「递归自我改进(RSI)在2028年底前发生的概率约为60%。」

作为《Import AI》通讯的创办者与主笔,克拉克长期追踪AI能力演进。此次他同步发布了一篇深度分析,系统论证了这一观点。

这一预测指向一个根本性变革:我们的社会是否已为AI驱动的自动化研发浪潮做好了准备?其潜在影响深远,迫使人们重新审视自身在技术演进中的角色。

克拉克在文中强调:若这一天到来,人类将跨越「卢比孔河」,步入一个几乎无法预测的未来

他认为2026年发生RSI的可能性较低,但未来一两年内,我们很可能在非前沿模型上看到概念验证:一个AI模型能够端到端地训练其「继任者」。这一结论并非基于内部机密,而是源于对arXiv、bioRxiv、NBER等公开论文平台的数据分析,结合其对前沿实验室产品的持续观察。克拉克将这些碎片信息整合,勾勒出AI发展的全景图。

在他看来,AI工程化生产所需的核心组件已基本就位。剩余的关键问题是:模型何时能积累足够的「创造性思维」,开始像人类研究员一样,实质性地推动技术前沿。

四年演进:从30秒到12小时的任务处理能力

克拉克的核心论据建立在一系列清晰的能力增长曲线上。

首先看METR机构绘制的时间轴。该机构专注于评估AI能力,其追踪的关键指标是:当AI独立完成一项任务的成功率达到50%时,该任务若由熟练人类完成所需的时间。

这一数字的演变轨迹极具说服力:2022年,GPT-3.5对应时长为30秒;2023年,GPT-4提升至4分钟;2024年,o1模型达到40分钟;2025年,GPT-5.2(高配版)突破6小时门槛;至2026年,Claude Opus 4.6已能处理长达12小时的任务。

短短四年,能力跨度增长1440倍。AI能力研究员阿杰亚·科特拉进一步预测,到2026年底,这一数字有望突破100小时。届时,AI将能覆盖许多需要数日完成的软件工程或研究辅助任务。

编程能力的飞跃同样显著。以SWE-Bench基准测试为例,它衡量AI解决真实GitHub工程问题的能力。2023年底,Claude 2的得分仅为2%。而今年,Claude Mythos Preview的得分达到93.9%,意味着该基准近乎被完全攻克。

再看CORE-Bench,它测试AI根据学术论文及对应代码库独立复现实验结果的能力——这正是AI研究员的基础工作之一。2024年9月该测试推出时,最佳成绩为21.5%。到2025年12月,Opus 4.5在特定框架下的验证准确率达到77.78%,经人工校验后高达95.5%,项目方宣布CORE-Bench已被解决。

15个月内,从21.5%到95.5%,进步速度一目了然。

MLE-Bench测试AI独立参加Kaggle数据科学竞赛的能力,覆盖75个真实项目。2024年10月发布时,最高分仅为16.9%;至2026年2月,Gemini 3结合搜索工具的组合,分数已跃升至64.4%。

Anthropic内部还有一个更直接的测试:让模型优化一段仅使用CPU的小型语言模型训练代码,比拼优化后的速度提升。2025年5月,Claude Opus 4的优化倍数为2.9倍;11月,Opus 4.5达到16.5倍;2026年2月,Opus 4.6提升至30倍;至2026年4月,Claude Mythos Preview已实现52倍优化。

不到一年,从2.9倍飙升至52倍。这直观展示了AI在「优化AI训练代码」这一核心工程任务上的进展速率。

接管99%:AI如何自动化研究中的工程性工作

这引出一个核心问题:AI研究中,纯粹的工程劳动与真正的创意灵感各占多少?

克拉克引用爱迪生的经典框架:天才是1%的灵感和99%的汗水。他认为AI研究同样遵循这一比例。

典型的AI研究循环是:基于现有系统扩大规模,识别并修复工程瓶颈,然后进入下一轮迭代。其中绝大部分工作是数据清洗、实验运行、参数调整、论文研读、结果复现……这些属于「汗水」范畴。真正改变范式的发明,如Transformer架构或混合专家模型(MoE),只占1%。而当前趋势是,那99%的工程性工作正被AI快速接管。

克拉克列举了几个明确信号:

首先,AI已能管理其他AI。在Claude Code、OpenCode等工具中,一个AI可扮演「项目经理」角色,将复杂任务分解并分发给多个子AI并行处理,最后汇总结果。这种工作流与人类研究团队的协作模式已无本质区别。

其次,PostTrainBench测试揭示了一个趋势:AI能否自行微调开源小模型以提升特定任务表现?这通常是资深研究员的职责。截至2026年3月,AI系统在此任务上已达到人类研究员效果的一半左右,提升幅度约为25%-28%,而人类基线提升幅度为51%。

更引人注目的是Anthropic内部的概念验证——「自动化对齐研究」:让一组AI智能体在AI安全问题上进行自主攻关。结果显示,AI提出的解决方案甚至超过了Anthropic人类研究员设定的基线水平。

综合这些证据,克拉克判断:AI目前已能自动化AI工程中的绝大部分工作。至于AI研究本身有多少能被自动化,虽未完全清晰,但迹象已足够明确。

行业质疑:理性审视RSI的挑战与定义

克拉克的观点也引发了行业内的理性质疑。

华盛顿大学机器学习教授、《终极算法》作者佩德罗·多明戈斯回应道:「自50年代LISP语言诞生以来,AI已能构建自身。核心在于这一过程带来的是递增回报还是递减回报——目前尚无证据支持前者。」

这一观点切中要害。递归自我改进能循环不等于循环有收益。若每一代AI的自我优化仅带来边际改善,而非指数级放大,其实际影响将非常有限。

研究员丹·布里克利则对概念本身提出质疑:「RSI是否存在一个权威的定义?」

另一个尖锐观察来自账号@crepesupreme:克拉克预测2027年概率为30%,2028年为60%。这意味着一年内概率跳升30个百分点,暗示2027至2028年间可能存在某个突变性能力事件。那么,这个具体事件可能是什么?

克拉克在通讯文章中回应了这一问题。他认为,AI研究仍需某种创意突破才能真正进入「自我研发」循环,而AI目前在创造性方面尚未展现出变革性能力。这正是他只给2027年设定30%概率的原因。若这一能力缺口在2028年底前被填补,概率则会升至60%。同时他也承认,自己预测的是概率,而非确切时间点。

还有人提出更直接的问题:「你在Anthropic工作,为何要查阅公开数据?直接询问你的研究员同事不就行了?」

克拉克的答案体现了其严谨性:使用公开数据是因为其具有可验证的公信力。他寻求的不是内部主观判断,而是任何人皆可独立核验、基于客观事实的结论。

缩窄的窗口:治理的紧迫性与行业动向

那么,为何克拉克不给2027年更高的概率?

他在通讯文章中解释,因为AI研究仍包含对创意和直觉的要求,而AI目前在这一领域仅有「诱人的早期信号」,尚未取得系统性突破。他举了两个例子:一是Gemini模型参与攻克埃尔德什数学问题,在700个问题中解出1个被数学家认为具有原创性的解;二是斯坦福、UBC等机构与Google DeepMind的合作中,AI在发现新数学证明方面起到了「非常实质性的作用」。

这些成果在AI能力演进的时间轴上,可被视为早期信号。克拉克估计,若到2028年底仍未出现所述情况,可能意味着当前技术路径存在根本性的能力天花板,必须依赖人类创意才能突破。

然而,比「是否发生」更关键的问题是「发生之后」的应对。

Anthropic在2026年3月宣布成立「Anthropic研究所」时,其官方声明中写道:「如果AI系统的递归自我改进确实开始发生,那么世界上谁应该被告知,以及这些系统应如何治理?」

连Anthropic自身,也尚未拥有这一问题的完整答案。

克拉克在文章中提出了一个更技术性的担忧:假设当前AI对齐技术准确率为99.9%,在递归迭代50代后,准确率将衰减至95.1%;迭代500代后,将骤降至60.5%。除非对齐方案在理论上能保证对更智能的系统同样有效,否则问题将迅速失控。

或许,克拉克真正想传达的是:留给人类进行有效治理的时间窗口有限,且正在快速缩窄。他希望通过这篇文章提醒业界:关于此事的讨论、研究与治理设计,所剩余的时间比大多数人想象的更短。

行业动向印证了这种紧迫感。根据山姆·奥特曼的直播及相关报道,OpenAI的目标是让AI在2026年9月前达到「AI研究实习生」水平,并在2028年实现更完整的自动化研究员能力。Anthropic自身也在推进自动化对齐研究的概念验证。一家名为「递归超级智能」的新公司刚完成5亿美元融资,其核心目标之一正是自动化AI研究。

整个行业,已朝这一方向全力加速。

克拉克总结道,无论从哪个维度审视,数据都指向同一方向。每一条能力曲线都在向右上方飞速延伸——时间越长,能力越强,且没有任何一条曲线显示出减速迹象。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多