亚马逊关闭开发者刷Token排行榜,成本控制新举措
摘要
亚马逊内部AI使用排行榜Clauderank因员工为刷排名创建大量无实际意义的任务,导致计算成本
如今不少科技企业内部正兴起一种略显扭曲的激励方式——鼓励员工使用AI工具,并按Token消耗量排名。初衷是好的,但执行层面却催生了另一种形式的无效内卷。最近亚马逊就因此栽了个跟头。

据《金融时报》披露,亚马逊内部曾存在一个名为Clauderank的非官方排行榜,用于追踪员工对Claude AI工具的使用活跃度。设计初衷是衡量AI采纳率并激发员工尝试。
但事与愿违。为抢占榜单高位,员工开始系统性钻空子——创建大量AI智能体,执行毫无业务价值的任务,只为推高Token消耗量。这种行为被称为“刷Token”(tokenmaxxing)。后果是计算成本飙升,最终迫使排行榜下架。
亚马逊一位高级副总裁坦言,排行榜初衷是鼓励AI探索,但伴随的算力开销超出承受范围。
无独有偶,今年4月Meta也因同样原因关闭了非官方排名系统Claudeoconomics——大规模刷Token导致成本失控。
这暴露了一个深层问题:Token使用量虽易量化,却无法反映实际业务价值。AI巨头们一直在探索更科学的评估方式,但成效有限。Salesforce曾尝试开发新指标,市场反响平淡。
企业当前面临微妙平衡:既要鼓励员工大胆使用AI,又需控制计算成本。今年3月,普华永道美国CEO保罗·格里格斯强调,不拥抱AI的员工未来将举步维艰。但如今传达给员工的信息似乎变成了:多用AI,但别用过头。
归根结底,这是管理智慧的考验。把Token消耗量当KPI,如同用代码行数衡量程序员价值,极易走偏。
Q&A
针对读者常问的几个问题,统一解答如下:
Q1:什么是“刷Token”?为何这种怪异行为会滋生?
A:员工为在公司AI排行榜上获得靠前名次,故意让AI执行无意义任务,如智能体相互聊天、生成大量无效文档,以堆高Token消耗。根源在于排行榜将“Token使用量”设为唯一考核标准,员工自然追逐数字而非实际业务价值。
Q2:亚马逊的Clauderank排行榜为何必须关闭?
A:直接原因是成本失控。按Token用量排名的机制催生了大量无效调用,推高算力支出至不可持续水平。高管坦言出发点虽好,但代价过高。
Q3:企业应如何平衡这一矛盾?
A:这是行业级难题。单纯以Token量考核易引发滥用,而用业务价值衡量又极难量化。目前尚无成熟方案。务实做法是:在积极推广AI应用的基础上,建立更精细的评估体系,兼顾消耗量与输出价值,着重管控工具使用场景。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。