Anthropic AI不扩散条约深度解读:目的与影响
摘要
Anthropic呼吁谨慎开发AI,因AI已具备自我迭代能力,代码生成比例从九成降至两成,预计一
坐不住了。Anthropic 这次居然亲自下场,呼吁大家把手中的 AI 开发缓一缓。
昨天,他们直接发了一篇文章,核心意思再直白不过——劝大伙儿谨慎看待 AI。因为搞不好哪天,AI 自己就能把自己给迭代出来,完全用不着人类插手。
消息一出,说是一石激起千层浪都不夸张。帖子发出来不到半天,浏览量直接冲到 1000 多万。
赶紧去 Anthropic 的官网仔细拜读了这份报告。读完感觉,嗯……有点不对味儿。
简单来说,它确实喊了“慢点”,“别卷了”,但指望大家真能停下来,恐怕是难。
原文标题叫“When AI builds itself”(当 AI 自我迭代时)。
逻辑是这样的:Anthropic 认为现在的 AI 已经牛到了可以自己给自己改 bug、自己给自己写代码的程度。
他们内部的数据很直观:2025 年 2 月的时候,库里 9 成以上的代码还是工程师手搓的。但等到 Claude Code 发布后,到今年 5 月,这个比例已经掉到了 2 成。甚至有员工直接承认,自己已经快五个月没写过一行代码了。
不光数量在涨,质量也在爬坡。下面这张图展示了 AI 面对四种不同难度任务时的完成率。能看到随着模型能力往上涨,AI 在各类任务上的成功率也在稳步走高。即便是最难、没有标准答案的开放性问题,Claude 也有 70% 左右的概率能搞定。而去年九月,这个数字还不到 20%。
从黄色到蓝色分别是:特别简单的任务、常规任务、实质性任务、开放式问题


更关键的是他们的内部判断:很多人表示,现在人类和 Claude 写出来的代码质量还是五五开,但只需要一年,一年后大局就会彻底翻盘,Claude 写出来的代码将全面超越人类。
莫非人类真要药丸?
Anthropic 对此也表示不知道。他们干脆给人类的未来规划了三种结局。
第一种,无事发生。假设因为种种原因(缺卡、缺电、缺水、缺算法),现在的 AI 已经走到了自己的天花板,未来就此嗝屁。当然,他们自己都认为这种可能性不大。
第二种,量变但没质变。人和 AI 一起,造出安全可信的系统。AI 承担绝大部分重复劳动,但审查和指挥权仍然攥在人类手里。不过是角色的转换。听起来是个没啥大问题的好结局。
第三种,就是开头那种让人后背发凉的结局了。AI 掌握了足够强大的创造力,实现了完全自动化迭代。到那时,模型能力的提升中,算力成了唯一因素,人类或将不再重要。在这个过程中,AI 可能完全听命于人类,老老实实干活,也可能彻底失控,摆脱限制。再往后,就没人能预测了。
所以才有后面的呼吁:搞一套能互相监督、全员躺平的探索机制,让全世界都参与到这件事里来,确保大家能随时给 AI 研究踩一脚刹车。
说实话,刚读完感觉它说得好像挺有道理。但转念一想,不对啊。
Anthropic 虽然给出了三种可能的未来,但仔细看:第一种是他们自己否定的过去式,第二种是咱们正在经历的现在进行时,第三种才是他们真正担忧的未来。与其说是三种可能,不如说是层层铺垫。整篇文章看下来,数据是自己定义的,采集、解释、评价也全是自己搞的。考生和考官一肩挑,效果上多少得打点折扣。
再者,AI 研发是你说停就能停的吗?这玩意儿又不是核能,搞个“不扩散”条约就能监管。AI 只要有数据中心就能跑,根本没什么办法真正管住。总不能要求每家科技公司都互相开放所有数据区,让大伙儿互相盯着看对方拿显卡在干啥吧?真要搞这么透明,建议 Anthropic 先学习一下怎么做开源,否则这种话说出来确实没啥说服力。
而且,这次提建议的时间点也很微妙。Anthropic 这家公司,作风在业内一直颇有争议。做牛逼模型的公司很多,但风评能那么始终如一的,也就它们一家了。打开官网看公司介绍,几乎每个字都在向你强调安全。你甚至能找到从产品到应用的全套安全管理措施,还有专门给 Claude 写的安全宪法。
但这些安全措施真管用吗?现实远比你想象得更复杂。前几年,A 社还承诺过除非提前确保安全措施准备妥当,否则不会开始训练新模型,结果很快自己就把承诺撤回了。今年 2 月面对《时代》周刊采访时,首席科学家直接表示,这种单方面的承诺并不合理,公司可能考虑放弃。
说白了,安全和发展这两词,在硅谷就像个箩筐,哪里需要哪里装。当理想主义撞上商业竞争,刺刀见红的时候,所谓的安全往往也得给季度财报和市场份额让路。
比如之前疯狂渲染焦虑的 OpenAI 奥特曼,最近也悄悄改了话锋。以前说 AI 会取代大部分工作,最近又承认自己之前的判断草率了。英伟达的老黄更激进,在采访里直接吐槽现在的很多言论太科幻、太戏剧化、毫无帮助,不知道有些 CEO 为什么想扮演上帝,夸大威胁来吓唬人。
咱虽然不知道他在点谁,但也能看出来,即便都在 AI 最前沿,大家的看法也天差地别。正所谓屁股决定脑袋,看他们的观点,还得看他们所处的实际位置。
实际上,最近一两个月,Anthropic 的日子不算特别好过。他们 3 号刚推出的 Claude 4.8 略显拉垮,再没了曾经的断档领先感。而隔壁的 OpenAI 则是全军出击,编程和图像生成领域两开花。奥特曼天天在网上花式找理由重置 Codex 的额度,直接成了各路开发者心中的超级大善人。
Anthropic 这边,为了能搞到更多显卡和算力来做出更强的模型,已经开始提交 IPO 申请,开始做融资上市的准备了。
一来一回,因素越叠越多,这个“慢点开发”的号召,看起来自然也就没那么有分量了。
说到这,想起今年去 Google I/O 的事。当时 DeepMind 的 CEO 哈萨比斯在现场说:现在我们正站在 AI 奇点时代的山麓。结果还没往上爬两步呢,A 社就在前面把头扭过来,告诉你山上有风险,攀登需谨慎,为了大家的安全,我们还是都别爬了吧。
倒也有点道理,毕竟这些大厂的顶尖研究员肯定能看到更多东西。但多少像是美丽而无用的废话。因为众所周知,只要山在那儿,人就一定会想登上去看看的。
撰文:风华 & 早起
编辑:早起 & 江江 & 面线
美编:素描
图片、资料来源:
X,Anthropic,联合国,TIME,Youtube,部分图源网络

来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。