产业资讯深度解读

Anthropic突然叫停AI研究，深度解读

2026-06-07

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

核心信号：Anthropic 官方数据证实，AI 已开启自我进化进程。这不是夸张表述，也不是远期

核心信号：Anthropic 官方数据证实，AI 已开启自我进化进程。

这不是夸张表述，也不是远期预测。他们在官方博客中直接引用内部指标，判定 Claude 正在推动 AI 发展加速，这条路指向的正是递归自我提升（RSI）。

我们的内部数据显示，Claude正在加速AI发展，这可能是一条递归自我提升（RSI）的路径。

来看这组数据：截至今年 5 月，超过 80% 的 Anthropic 代码由 Claude 生成。

而在 Claude Code 推出之前，这个比例仅为个位数。

同时，Anthropic 工程师每季度交付的代码量，已是 2021–2025 年平均值的 8 倍。

更关键的是质量维度——

面对最开放、最模糊、甚至答案形态都不明确的编程任务，Claude 当前的成功率达到 76%，而六个月前只有 26%。

半年内跃升 50 个百分点。

Anthropic 内部已有不少工程师认为，Claude 生成的代码质量与人类持平。

预期年内将实现超越。

Anthropic 同时强调，若这一趋势延续，AI 自主设计并构建下一代 AI 完全可行。

这可能彻底改变社会，在医疗、科技、经济领域带来巨大的好处。但也可能让对齐问题叠加恶化，最终导致失控。

因此，Anthropic 率先呼吁：

如果存在可验证机制，能确保所有 AI 实验室确实没有暗自加速，我们愿意减速乃至暂停。

此外，这篇博客还释放了大量值得深挖的观点与事实。

以下提炼核心脉络，便于快速掌握。

Anthropic 长文定调

AI 领域的摩尔定律已现

Anthropic 建立了一个全新衡量维度：「AI 能独立完成的任务时长」。

2024 年 3 月，Claude Opus 3 可处理人类约 4 分钟的软件任务。

一年后，Claude Sonnet 3.7，1.5 小时。

又过一年，Claude Opus 4.6，12 小时。

而最新的 Mythos，在内测中展示的能力是：

可连续工作「至少」16 小时，已触及 METR 测试框架的测量上限。

翻倍周期从原来的 7 个月缩短至 4 个月。

若趋势不变，2027 年可能达到数周级别。

Claude 撰写绝大部分 Anthropic 代码

截至2026年5月，我Anthropic代码库的代码，超过80%由Claude编写。
在Claude Code发布前，这个数字一直只有个位数。

这一变化同样体现在工程师的工作模式上。

在 Anthropic 创立前四年，工程师每日合并的代码行数基本持平。

2025 年，Claude 开始自主写代码，合并数陡然飙升。

如今，2026 年第二季度，工程师每日合并的代码量是 2024 年的 8 倍。

代码量高速增长，质量是否注水？

Anthropic 数据显示，过去一年工程师纠正 Claude 的频率持续下降。

这一点在 benchmarks 中清晰可见，如下图所示。

所有难度类型的任务中，Claude 的成功率无一例外全线攀升。

因此，Anthropic 目前已直接使用 Claude 进行代码审查。

是的，所有提交至代码库的变更，都先经 Claude 自动审核，检查 bug、安全漏洞及其他缺陷。

回溯分析表明，若此前每次改动都引入此自动审查，约三分之一导致 claude.ai 线上事故的 bug，将在上线前被拦截。

要知道，编写这些代码的工程师已是全球构建 AI 系统最顶尖的群体。

Claude 正在捕获他们的错误。

创造力的放大镜

接下来看 Claude 在研究层面的参与深度。

Anthropic 有个惯例：每次发布新模型，都会给 Claude 一段训练小型 AI 模型的代码，要求其在保证正确性的前提下，将运行速度优化至最快。

2025 年 5 月，Claude Opus 4 给出的结果是：加速 3 倍。

2026 年 4 月，Claude Mythos Preview 实现了 52 倍。

作为参照，熟练的人类研究员需要 4 到 8 小时才能勉强达到 4 倍。

不到一年，Claude 已超越人类。

2026 年 4 月，Anthropic 向 Claude 部署了一项 AI 安全研究：核心问题是「弱模型能否可靠监督强模型」，并让 Claude 自行提出假设、设计实验并执行。

人类表现：两名研究员耗时约一周，将 gap 缩小了 23%。

而 Claude，在约 800 小时、消耗约 18,000 美元算力后——

将 gap 缩小了 97%。

我们该何去何从？

至此，结论已经足够清晰。

人类在AI开发流程里的角色，每一个环节都在收窄。

代码 — Claude 编写。代码审查 — Claude 执行。实验运行 — Claude 快出一个数量级。实验设计 — Claude 已开始自主进行。

人类目前仅存的比较优势，是研究品味与判断力。

但这一优势能维持多久？

Anthropic 在博客中坦言，他们也不确定。

一种可能是，「研究品味」像此前 AI 无法胜任的其他能力一样，先被认定不可能，然后突然实现。

正如幽默理解、心智理论展现、语言谜题破解，都经历了相同的曲线。

另一种可能是，即便 Claude 永远无法真正掌握研究品味，仅凭当前加速趋势，每位人类研究员能同时指挥的工作量已放大数倍。

你无需 AI 完全替代你思考，它只需将全部「执行」层工作承担，你仅需做那 5% 的方向取舍。

RSI 的三种未来

博客结尾，Anthropic 描绘了围绕「自进化」趋势的三种潜在演化方向。

1、停滞。

那些指数曲线本质上是 S 曲线。

研究判断力或许无法通过规模扩展解决，需要全新的架构突破。

抑或瓶颈卡在能源、芯片、算力的物理供应链。

但即便 AI 能力止步于当前水平，也将引发世界级重大变革。

近期的 Project Glasswing 案例：Mythos Preview 上线头几周即发现超一万个高危与严重级别软件漏洞，遍布全球最关键系统。

2、AI 持续加速，人类依然掌握方向盘。

组织效率将指数级提升，100 人团队可完成 1 万乃至 10 万人的工作。

Anthropic 认为我们大概率正步入这一场景。

不过他们也观察到阿姆达尔定律在组织中的体现——

Claude 快速生成代码后，代码审查成为新瓶颈。新想法、新工具、新实验爆炸式涌现，远超组织的消化能力。

瓶颈不会消失，只会转移至下一环节。

3、AI 实现完全递归自我提升，开始自主制造下一代版本。

在该场景下，AI 发展速度完全取决于算力。人类退至监督、验证、审核位置。

若真发生，这种能力大概率将迁移至其他科学领域：医学、材料、能源，全线爆发。

当然，另一种未来是对齐失败。

这种情况下，偏差将在 AI 自我迭代过程中逐级累积，最终——全面失控。

OMT

以上是 Anthropic 本次关于自进化最核心的几大论点。

坦白说，起初并未太在意，毕竟 Anthropic 即将 IPO，这波操作看起来像典型的「Anthropic 式」公关？

但这次或许真不一样。

因为就在几天前，OpenAI 也发布了类似的博客：

我们也在当今系统中看到自进化的早期迹象： AI的发展本身也被AI加速。我们预计这将加剧开发商和国家之间的竞争压力，并带来现有机构无法应对的治理挑战。随着RSI的出现，社会需要方法塑造AI的发展轨迹，确保其服务于人类利益。

奇点似乎比所有人预测的更早抵达。

博客：https://www.anthropic.com/institute/recursive-self-improvement

参考链接：[1]https://x.com/kimmonismus/status/2062517474277675102[2]https://x.com/anthropicai/status/2062568873321513443

来源：互联网

上一篇 谷歌Gemini AI搜索用户达25亿月活超9亿 下一篇 微信互联A2A助手测评：AI直接调动微信操作链路变革

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。