产业资讯最新省钱

Claude 5亿Token一夜暴涨60倍，最新省钱攻略

2026-06-01

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

一家企业因未设额度上限一个月在Claude平台烧掉5亿美元。谷歌云用户API密钥被滥用致账单

30天内AI账单狂飙5亿美元！

科技圈近日曝出一则令人震惊的消息。据Axios披露，某企业竟在短短一个月内，于Claude平台消耗了5亿美元的Token费用。

原因令人哭笑不得：管理层为员工开通Claude账号时，遗漏了使用额度上限的设置。

这不是孤例——AI账单“爆雷”正在频繁上演。

今年4月，一名谷歌云用户因遗留的API key遭恶意滥用，原本仅有7美元预算的账户，一夜之间收到1.8万美元的账单。

这位倒霉的用户叫Jesse Davies，澳大利亚AI顾问兼Agentic Labs创始人。他自认为给Google Cloud账户设了两道屏障：一个10澳元（约7美元）的预算预警，外加一个1400美元的硬性消费上限。

据Tom's Hardware报道，攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务，狂发了6万多个请求。结果，两道防线全部失效：账单计算存在延迟，等系统反应过来，金额已飙至1.8万美元。

5月中旬，开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图：30天，OpenAI API账单高达130万美元。

他的团队只有三个人，却指挥着100个Codex智能体并行运作：30天消耗6030亿个Token，跑出760万次请求。不过，这130万美元并非他自掏腰包。

Steinberger今年2月加入了OpenAI，这130万美元被当作一次内部实验：

测试在不考虑Token成本的情况下，AI编程能达到什么极限。他补充说，这还是在Codex“高速档计费”下的结果，关掉之后大概只需30万美元。

更早之前，Uber的CTO Praveen Neppalli Naga向The Information坦言，公司4月份就已将全年的Claude Code预算消耗殆尽。其COO更是公开表示，AI成本已经越来越“难以自圆其说”。

5亿、130万、1.8万，这些金额虽差出几个数量级却指向同一个事实：

在智能体时代，无论是失控的密钥、昼夜无休的智能体军团，还是忘了设置上限的账号，任何一个疏忽，都能让你的Token账单一夜爆仓。

AI账单为何会爆仓？

答案藏在计费模式的根本变革中。

从今年4月起，OpenAI的包月计费模式全面转向按Token用量计费。

4月2日，Codex计费从按消息估算改为按Token用量对齐：输入、缓存输入、输出三类Token单独计费。到4月23日，这套规则已覆盖所有Enterprise、Edu、Health、Gov方案——月费中那笔隐形的折扣被悄然抽走。

GitHub紧随其后，刚刚官宣：所有Copilot套餐从2026年6月1日起，转向按用量计费。旧的高级请求逻辑被废除，取而代之的是AI额度，按输入Token、输出Token、缓存Token的实际消耗，对照每个模型的API费率进行结算。

GitHub官方解释了这么做的原因：

眼下，一个快速的聊天提问，和一次跑好几个小时的自主编码任务，用户花的钱却一样多。GitHub一直在为那些跑重度任务的用户暗中买单，但这套模式已经难以为继。

在AI智能体崛起之前，聊天和代码补全的成本相差无几，月费还能兜得住。

但智能体崛起后，一次任务能连续跑几个小时、改动整个代码库，重度用户和轻度用户的成本差直接拉大到几个数量级。月费制在这种差距面前，最终崩盘。

消息一出，Reddit和X上一片哗然。

一位ID为JBusu的开发者晒出了账单截图，直言新定价就是个“笑话”。原本28.12美元/月的开销，按新制要支付746.01美元。他已决定退订，并感慨道：“这个价格，我自己租云服务器都还便宜。”

另一位用户的截图更夸张，费用从50美元一路飙升到3000美元。他直呼定价如此离谱，“还有人继续订阅吗？”

不过，也有Copilot老用户出来反驳：这些极端账单多半是“vibe-coder”（凭感觉编码者）们不把烧Token当回事给烧出来的，未必能代表正常使用。

一位老用户在评论区留言：“我整天都在用，月底基本不超额，很难相信这是工作复杂度的差异。”另一位用户则更直接：“就是有人要全自动的YOLO模式开发，让AI随便跑。这种浪费被剔除，对其他人反而是好事。”

有一点必须清楚：GitHub并没有废除月费，基础订阅价格并未改变。真正变化的，是额外用量、智能体任务、更贵的模型调用，从此进入了用量计费时代。

受到冲击最大的，是那些依赖Copilot运行长链任务的重度智能体用户。

被自己人玩坏的排行榜

月费模式失守，一面是平台更改了计费规则，另一面则是使用AI的人，自己也在拼命烧钱。

5月，Business Insider报道，Amazon下线了一个名为KiroRank的内部AI使用排行榜。

该报道援引知情人士的话称，这个榜单悄然催生出一种奇怪的工作方式：部分员工为了在榜单上多爬几位，会去刷一些并不能解决实际问题的Token消耗，纯粹为了排名。

事情曝光后，Amazon高级副总裁Dave Treadwell直接向全员喊话：“别为了用AI而用AI。用它去解决客户问题，解决业务问题，去创新。”

这事虽有些荒唐，却毫不意外。当“烧Token”能上榜，员工自然就会去烧Token。

硅谷给这种现象起了个专门的名字：Token maxxing（极限烧Token），把消耗量当成了生产力。

Axios的报道也提到，有CTO发现员工拿AI模型查天气、写日常邮件，这些简单到不行的事，却套上了最贵的前沿模型，账单就这样悄无声息地飞涨。

KiroRank并非Amazon官方考核体系，而是员工自发搭建的非正式工具。但它清楚地暴露了一个经典的管理学规律：当KPI设错的时候，人就会用最聪明的方式钻空子。

把“用了多少”等同于“干得好不好”——这正是这一轮AI浪费的制度性根源。

算Token账的人，已经在赚钱

Token账单焦虑的另一面，有人悄悄把它做成了生意。

第一条路：用上下文“喂饱”AI。

Glean是Arvind Jain自己的公司，做的就是企业AI工作助手：把分散在公司各处的知识统一打通，让员工的AI直接拿到上下文，不必再四处翻箱倒柜。AI少绕路，烧的Token自然就少。

这套机制让Glean的年度营收在15个月内翻了3倍，跨越3亿美元大关，客户包括Databricks、Reddit、Samsung。

第二条路：把活分给对的模型。

模型路由初创公司Factory AI干的就是这件事——自动把每个任务派给最合适的模型：简单任务走便宜档，复杂任务走顶配。Arvind也曾说过：路由做对了，能省10倍。

这两条路殊途同归：让AI干活，但别让它乱烧。

学术圈的研究，也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文，第一次系统拆解了智能体编码任务到底是怎么烧钱的。

结论一：智能体任务的Token消耗，可达普通代码推理和代码对话的上千倍，推高成本的主因是输入Token。

结论二：同一个任务跑多次，Token消耗能差出30倍。

结论三：更高的Token消耗，并不必然带来更高准确率。精度往往在中等成本处见顶——再往上烧，钱花了，效果反而饱和。

论文还发现，前沿模型甚至连预测自己要烧多少Token都做不到，普遍低估真实成本。

你以为多花钱就能多办事。实际是钱花了，活不一定更好，预算还总算不准。

当AI账单开始赶超人力成本

“这是我记忆中第一次，技术成本开始和人力成本持平。”

5月29日，Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样说道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。

他在Axios的访谈中提到，对于他的团队来说，算力成本已经远远超过员工薪资。

类似的现象正在多家公司涌现：从做企业AI的Glean，到卖AI算力的英伟达，再到应用AI的Uber，都在重新审视这笔账。

在Arvind看来，历史上技术只是企业整体成本中很小的一块，但现在AI成本已经能追平工资单了。很多企业的年度AI预算，通常一两个月就烧光了。

过去一年，AI使用率是一个被追捧的指标：多用就是先进，烧Token就是拥抱未来。如今，许多企业开始反思那句朴素的话：这些烧掉的Token，到底换来了什么？

免费包月畅用的窗口期，正在此刻悄然关上。

接下来，摆在所有开发者面前的是这样一个问题：如何精打细算，让每一个Token发挥出最大价值。

未来真正的赢家，毫无疑问将是最先学会算Token账的那一个。

来源：互联网

上一篇 大模型可解释性提升：2025权威方法对比 下一篇 黄仁勋未来十年判断：AI趋势深度解析

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

Claude 5亿Token一夜暴涨60倍，最新省钱攻略

摘要

AI账单为何会爆仓？

被自己人玩坏的排行榜

算Token账的人，已经在赚钱

当AI账单开始赶超人力成本

相关文章推荐