Claude 5亿Token一夜暴涨60倍,最新省钱攻略
摘要
一家企业因未设额度上限一个月在Claude平台烧掉5亿美元。谷歌云用户API密钥被滥用致账单
30天内AI账单狂飙5亿美元!
科技圈近日曝出一则令人震惊的消息。据Axios披露,某企业竟在短短一个月内,于Claude平台消耗了5亿美元的Token费用。
原因令人哭笑不得:管理层为员工开通Claude账号时,遗漏了使用额度上限的设置。

这不是孤例——AI账单“爆雷”正在频繁上演。
今年4月,一名谷歌云用户因遗留的API key遭恶意滥用,原本仅有7美元预算的账户,一夜之间收到1.8万美元的账单。

这位倒霉的用户叫Jesse Davies,澳大利亚AI顾问兼Agentic Labs创始人。他自认为给Google Cloud账户设了两道屏障:一个10澳元(约7美元)的预算预警,外加一个1400美元的硬性消费上限。
据Tom's Hardware报道,攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务,狂发了6万多个请求。结果,两道防线全部失效:账单计算存在延迟,等系统反应过来,金额已飙至1.8万美元。
5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单高达130万美元。

他的团队只有三个人,却指挥着100个Codex智能体并行运作:30天消耗6030亿个Token,跑出760万次请求。不过,这130万美元并非他自掏腰包。
Steinberger今年2月加入了OpenAI,这130万美元被当作一次内部实验:
测试在不考虑Token成本的情况下,AI编程能达到什么极限。他补充说,这还是在Codex“高速档计费”下的结果,关掉之后大概只需30万美元。
更早之前,Uber的CTO Praveen Neppalli Naga向The Information坦言,公司4月份就已将全年的Claude Code预算消耗殆尽。其COO更是公开表示,AI成本已经越来越“难以自圆其说”。
5亿、130万、1.8万,这些金额虽差出几个数量级却指向同一个事实:
在智能体时代,无论是失控的密钥、昼夜无休的智能体军团,还是忘了设置上限的账号,任何一个疏忽,都能让你的Token账单一夜爆仓。
AI账单为何会爆仓?
答案藏在计费模式的根本变革中。
从今年4月起,OpenAI的包月计费模式全面转向按Token用量计费。
4月2日,Codex计费从按消息估算改为按Token用量对齐:输入、缓存输入、输出三类Token单独计费。到4月23日,这套规则已覆盖所有Enterprise、Edu、Health、Gov方案——月费中那笔隐形的折扣被悄然抽走。
GitHub紧随其后,刚刚官宣:所有Copilot套餐从2026年6月1日起,转向按用量计费。旧的高级请求逻辑被废除,取而代之的是AI额度,按输入Token、输出Token、缓存Token的实际消耗,对照每个模型的API费率进行结算。

GitHub官方解释了这么做的原因:
眼下,一个快速的聊天提问,和一次跑好几个小时的自主编码任务,用户花的钱却一样多。GitHub一直在为那些跑重度任务的用户暗中买单,但这套模式已经难以为继。
在AI智能体崛起之前,聊天和代码补全的成本相差无几,月费还能兜得住。
但智能体崛起后,一次任务能连续跑几个小时、改动整个代码库,重度用户和轻度用户的成本差直接拉大到几个数量级。月费制在这种差距面前,最终崩盘。
消息一出,Reddit和X上一片哗然。
一位ID为JBusu的开发者晒出了账单截图,直言新定价就是个“笑话”。原本28.12美元/月的开销,按新制要支付746.01美元。他已决定退订,并感慨道:“这个价格,我自己租云服务器都还便宜。”


另一位用户的截图更夸张,费用从50美元一路飙升到3000美元。他直呼定价如此离谱,“还有人继续订阅吗?”

不过,也有Copilot老用户出来反驳:这些极端账单多半是“vibe-coder”(凭感觉编码者)们不把烧Token当回事给烧出来的,未必能代表正常使用。
一位老用户在评论区留言:“我整天都在用,月底基本不超额,很难相信这是工作复杂度的差异。”另一位用户则更直接:“就是有人要全自动的YOLO模式开发,让AI随便跑。这种浪费被剔除,对其他人反而是好事。”
有一点必须清楚:GitHub并没有废除月费,基础订阅价格并未改变。真正变化的,是额外用量、智能体任务、更贵的模型调用,从此进入了用量计费时代。
受到冲击最大的,是那些依赖Copilot运行长链任务的重度智能体用户。
被自己人玩坏的排行榜
月费模式失守,一面是平台更改了计费规则,另一面则是使用AI的人,自己也在拼命烧钱。
5月,Business Insider报道,Amazon下线了一个名为KiroRank的内部AI使用排行榜。
该报道援引知情人士的话称,这个榜单悄然催生出一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不能解决实际问题的Token消耗,纯粹为了排名。

事情曝光后,Amazon高级副总裁Dave Treadwell直接向全员喊话:“别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。”
这事虽有些荒唐,却毫不意外。当“烧Token”能上榜,员工自然就会去烧Token。
硅谷给这种现象起了个专门的名字:Token maxxing(极限烧Token),把消耗量当成了生产力。
Axios的报道也提到,有CTO发现员工拿AI模型查天气、写日常邮件,这些简单到不行的事,却套上了最贵的前沿模型,账单就这样悄无声息地飞涨。
KiroRank并非Amazon官方考核体系,而是员工自发搭建的非正式工具。但它清楚地暴露了一个经典的管理学规律:当KPI设错的时候,人就会用最聪明的方式钻空子。
把“用了多少”等同于“干得好不好”——这正是这一轮AI浪费的制度性根源。
算Token账的人,已经在赚钱
Token账单焦虑的另一面,有人悄悄把它做成了生意。
第一条路:用上下文“喂饱”AI。
Glean是Arvind Jain自己的公司,做的就是企业AI工作助手:把分散在公司各处的知识统一打通,让员工的AI直接拿到上下文,不必再四处翻箱倒柜。AI少绕路,烧的Token自然就少。
这套机制让Glean的年度营收在15个月内翻了3倍,跨越3亿美元大关,客户包括Databricks、Reddit、Samsung。
第二条路:把活分给对的模型。
模型路由初创公司Factory AI干的就是这件事——自动把每个任务派给最合适的模型:简单任务走便宜档,复杂任务走顶配。Arvind也曾说过:路由做对了,能省10倍。
这两条路殊途同归:让AI干活,但别让它乱烧。
学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750
2026年4月的一篇arXiv论文,第一次系统拆解了智能体编码任务到底是怎么烧钱的。
结论一:智能体任务的Token消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入Token。
结论二:同一个任务跑多次,Token消耗能差出30倍。
结论三:更高的Token消耗,并不必然带来更高准确率。精度往往在中等成本处见顶——再往上烧,钱花了,效果反而饱和。
论文还发现,前沿模型甚至连预测自己要烧多少Token都做不到,普遍低估真实成本。
你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还总算不准。
当AI账单开始赶超人力成本
“这是我记忆中第一次,技术成本开始和人力成本持平。”
5月29日,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样说道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。
他在Axios的访谈中提到,对于他的团队来说,算力成本已经远远超过员工薪资。
类似的现象正在多家公司涌现:从做企业AI的Glean,到卖AI算力的英伟达,再到应用AI的Uber,都在重新审视这笔账。
在Arvind看来,历史上技术只是企业整体成本中很小的一块,但现在AI成本已经能追平工资单了。很多企业的年度AI预算,通常一两个月就烧光了。

过去一年,AI使用率是一个被追捧的指标:多用就是先进,烧Token就是拥抱未来。如今,许多企业开始反思那句朴素的话:这些烧掉的Token,到底换来了什么?
免费包月畅用的窗口期,正在此刻悄然关上。
接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个Token发挥出最大价值。
未来真正的赢家,毫无疑问将是最先学会算Token账的那一个。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。