菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > Token单价已死,交付结果当立:2024年AI服务价值评估与选择指南
产业资讯

Token单价已死,交付结果当立:2024年AI服务价值评估与选择指南

2026-05-16
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

AI行业正告别免费模式,转向付费订阅等商业路径。因算力成本激增,“先圈地后收割”逻

全免费的时代正在落幕,AI行业正集体转向一条更现实的商业道路。

回想GPT刚问世时,用户增长的曲线实在太过耀眼,以至于很长一段时间里,无论国内国外,几乎所有AI产品都遵循着同一个剧本:先用免费吸引海量用户,把盘子做大,再琢磨怎么赚钱。这几乎是互联网时代的金科玉律。

然而,AI的物理规律和互联网截然不同。算力消耗并非随着用户增加而边际递减,恰恰相反,用户越多、调用越频繁、任务越复杂,算力需求是指数级攀升的。这是一种“逆边际成本”结构,是整个行业必须面对的根本性约束。

这意味着,传统的“先圈地、后收割”逻辑在AI领域行不通了。算力本身就是核心的生产资料,必须被纳入定价体系。行业的竞争焦点,正从“价格战”转向“价值战”。

理解了这一点,再看国内月活用户数第一的豆包推出付费订阅,就显得顺理成章,甚至可以说,这一步来得有些迟了。

3.45亿的月活用户,这个数字比国内其他主流AI应用的用户总和还要多。如此庞大的用户基数带来的算力需求,对任何负责基础设施的团队而言,都是巨大的挑战。要知道,即便是背靠谷歌千亿美元资本、自研TPU生态、拥有万卡级集群支撑的Gemini,其全球月活用户也不过7.5亿。

海量用户是甜蜜的负担。其中大量是进行基础查询、简单问答的“浅度用户”。即便需求简单,也不能通过降低模型响应质量来节省算力,那无异于自毁口碑。然而,正是这些免费且高频的浅度需求,在某种程度上消耗着宝贵的算力资源,同时也模糊了产品在专业用户心中的心智定位——他们更复杂、更消耗算力的生产力需求,反而被淹没其中。

因此,通过付费订阅进行需求分层,就成了必然选择。将查资料、基础文案、日常问答等算力需求低的功能保留免费,面向复杂任务和生产力场景提供更强大的付费服务。这既能维持基本盘,又能筛选出高价值用户。事实上,这已是全球AI应用的通行做法:从Anthropic的Claude,到谷歌的Gemini,再到OpenAI的GPT,都采用了“免费+订阅”的混合模式。不仅如此,订阅费用还在普遍上涨,Anthropic甚至为企业级客户引入了按实际算力消耗付费的机制。

国内趋势同样明显。自2026年2月以来,智谱已连续三次上调其模型API定价,最新发布的GLM-5.1再度提价10%。结果是,2026年第一季度其API调用均价提升了83%,但调用量却逆势增长了400%,呈现“量价齐升”。Kimi的会员体系也从最低档9.9元迭代至49元起,最高档达699元/月,并引入了Agent集群权限等差异化增值服务。

这些举措非但没有吓退用户,反而在专业群体中建立了更强的“专业心智”,初步形成了商业飞轮。豆包的付费订阅,只是一个开始。尚未设立阶梯收费的国产AI应用,跟进只是时间问题。然而,订阅模式远非终点。AI商业的终局,很可能是一门为“交付结果”定价的生意。

01 价格战的红海与商业模式的困局

一个有趣的对比是,就在豆包酝酿收费的几天前,DeepSeek进行了一场令行业侧目的降价。4月25日,其V4-Pro模型价格暴降75%,输入价格降至3元/百万Tokens,输出价格降至6元。次日,该模型缓存命中价格更是降至惊人的0.025元/百万Tokens。与此同时,V4-Flash的缓存命中价格低至0.02元/百万Tokens。

对比GPT-5.5的2.5美元/百万Tokens和Claude Opus 4.7的15美元/百万Tokens,这个价格几乎等同于白送。

但低价,真的意味着商业上的胜利吗?

以豆包选择的SaaS订阅模式为例,这条路看似保守却稳妥。然而,将SaaS模式套用在AI产品上,其本质依然是在为消耗的Token(模型处理的基本单位)买单。无论包装成“标准版”还是“专业版”,底层的成本核算逻辑并未改变:用户多用一次,平台就多烧一份算力。

这让人想起2024年那场席卷行业的大模型价格战。当时,阿里云通义千问主力模型价格直降97%,百度更是宣布部分模型免费,整个行业陷入“谁比谁更便宜”的内卷。当时就有观点指出:当所有玩家都挤在同一个计量单位上竞相压价,行业性的负毛利就不是意外,而是结构性的必然终点。

两年过去了,V4将价格地板又凿穿了一层,但游戏规则本身并未改变。

近期一篇名为《Token经济学》的深度分析,提供了一个关键的观察视角:当前的AI商业化,早已不是一道简单的“Token单价”算术题。不同的任务类型——轻量检索、复杂推理、长时运行、多轮交互——对应着完全不同的成本结构。一个轻量检索任务中,搜索和知识库查询的成本可能是Token本身的数十倍;而在一个重度编程会话中,模型推理成本才是大头。根本不存在一张通用的“AI单位成本表”。

换句话说,“谁的Token更便宜”这个问题本身已经过时了。它预设了一个统一的计量单位,而现实是,计费对象正在快速裂变,价格维度正在扩散,Token只是其中最底层、最基础的一环。

《Token经济学》提出了一个五层结算栈的框架来理解这种演进:

  • 最底层是公用事业层:包括算力、Token、缓存、搜索等,可计量、可路由,如同水电煤。
  • 往上是协议与能力层:涵盖MCP、A2A等跨平台互操作接口。
  • 再往上是知识封装层:包括Prompt(提示词)、Eval(评估)、Memory(记忆)等行业经验的序列化封装。
  • 第四层是执行交付层:Agent作为被托管、被监控的“数字劳动力”运作。
  • 最顶层是结果与责任层:按最终产出(Outcome)收费,“结果”本身成为合同化的结算对象。

V4的降价,本质上是将第一层(公用事业层)的价格打到了接近免费。而目前国内多数厂商的商业模式,几乎完全压在这一层上竞争。从这个角度看,豆包的收费尝试,依然是在第一层内部进行的策略调整,是一种“只能在价格上做文章”的主动防御。

02 三条轨道:海外AI商业化的进阶之路

当国内厂商仍在Token单价的红海中缠斗时,大洋彼岸的AI商业化,已经沿着三条清晰的轨道并行演进,各自的前提和逻辑截然不同。

第一条轨道最为激进:按结果付费(Outcome-based Pricing)。

典型代表是Intercom的AI客服产品Fin,其定价为0.99美元/次,但只在AI真正解决了客户问题时才收费。何为“解决”?要么客户主动确认问题已处理,要么客户在AI回复后未继续追问。这套规则被写入系统,不依赖主观判断。Fin每周处理超100万次对话,帮助Intercom将AI相关营收拉升至过亿美元量级。Zendesk路径类似但更稳健,按自动解决的工单收费。

更引人注目的是Sierra AI,由OpenAI董事长Bret Taylor联合创办,从创立第一天起就完全基于结果定价,企业合同价格在5万到20万美元/年不等,仅用21个月ARR(年度经常性收入)就突破1.5亿美元,服务于超40%的财富50强企业,近期以150亿美元估值融资95亿美元。

第二条轨道更为务实:按动作消耗(Action-based Consumption)。

Salesforce的Agentforce没有一刀切地采用“按结果”模式,而是推出了Flex Credits体系:每个AI动作消耗20 credits(约合0.1美元),可覆盖最多1万Tokens的处理量。企业按500美元/10万credits批量采购。同时,系统仍保留按对话(2美元/次)计费选项,Copilot类产品则维持传统的席位制。三种模式并存,企业可根据自身负载灵活选择。

第三条轨道最为保守:混合订阅(Hybrid Subscription)。

ServiceNow的Now Assist将AI能力打包进企业级License,基础报价在15万至40万美元/年,AI功能作为附加模块叠加,形成“固定底座+超额用量”的混合结构。这条路能走通,得益于ServiceNow的客户已深度绑定在其ITSM(IT服务管理)生态中,替换成本极高,AI只是在现有护城河上增加了一层价值。

三条轨道的差异,表面是计费方式不同,深层是计费单元的升级。第一条计的是“已完成的工作”,第二条计的是“已执行的动作”,第三条计的是“已占用的席位和平台能力”。

但它们共享一个核心前提:无论计费单元是什么,都必须能在系统中有清晰定义、可被自动记录、且双方对其含义无争议。

将这个逻辑放回五层结算栈的框架,路径非常清晰:海外领先的AI商业模式并非只计算Token,而是先将计费单元从Token升级为Action(对应第二、三层),再进一步升级为Outcome(第五层)。这是一个分阶段的基础设施建设过程,每一级台阶都有对应的系统能力作为支撑。

由此可见,与国内仍聚焦于“按Token计费”的模式相比,这种更多元、更精准的商业模式,无疑更契合B端用户的根本诉求:用户最终为工作成果买单,而非为消耗的中间资源付费。

03 中国的现实:缺失的台阶与碎片化的战场

看到上述对比,一个常见的观点是:海外AI商业的成功,得益于其B端用户更充足的预算和更强的付费意愿。数据似乎支持这一点:2025年,美国四大科技巨头(微软、谷歌、亚马逊、Meta)的AI资本开支合计约2.5万亿软妹币,而中国七家头部互联网大厂的投入总和约为6300亿,不足前者的四分之一。

然而,将“按结果付费”等模式在中国难以推行的原因,仅仅归结为预算差异,可能过于简单。一个更深层、更关键的原因是:在中国的商业环境中,“效果”本身往往难以清晰定义,应用场景也高度碎片化。

Intercom敢按单次服务收费,是因为Zendesk等公司花了十几年时间,将“客户工单”硬化为一套完整的、可追溯的系统流程。Salesforce敢按Action收费,是因为它自身就是CRM系统,对“发邮件”、“更新记录”等原子操作有清晰的日志定义。这些计费模式并非凭空创新的商业模式,而是建立在成熟的、数字化的业务基础设施之上。

反观中国,即便是客服这类看似标准化的场景,背后也隐藏着大量“信息孤岛”。

2025年,中国智能客服市场渗透率已超85%,但这85%的背后,是淘宝、京东、抖音、微信、小红书、小程序、电话、钉钉、企业微信等十多个互不连通的渠道在各自为战。客服需要同时监控多个后台,信息无法互通。一个客户可能在抖音咨询尺码,在微信询价,又在小红书吐槽发货慢——这三段对话在企业侧可能是三条独立记录,甚至根本没有进入系统(尤其是微信私域聊天,可能只存在于销售个人手机)。

如果说海外的AI商业化正在沿着五层结算栈逐级上移,那么国内的现状是:第一层(公用事业层)的价格地板已被击穿,但第二层到第五层之间,连稳固的“台阶”都尚未修好。

尽管国内也有“按效果付费”的尝试,但与海外“解决一个工单收一份钱”的模式相比,中国的版本更像“效果营销”的变体,而非AI服务的标准化计费革命。

目前,国内最成气候的类似模式是GEO(生成式引擎优化)赛道,即帮助企业优化在豆包、DeepSeek、Kimi等AI搜索中的品牌曝光排名,并按排名提升效果收费。在金融和营销领域也有零星尝试,例如蚂蚁数科提出,银&行只需提供业务目标、预算和客群,智能体自动执行全链路,最终按交易规模增长的净值以万分位到千分位抽成。

同样,在数字人直播领域,中科深智从2024年底开始与电商客户尝试分润模式,2025年正式推出AI RaaS业务,约定素材投不出去不收费,ROI未达标按比例退费。

但细究之下,国内的“按结果付费”,目前更接近于营销外包的效果对赌协议,其计费单元(如排名、GMV)与AI服务过程本身的关联度较弱,归因模糊,尚未形成标准化的AI服务计费单元。

04 正道:补上数字化与标准化的课

现阶段,国内的“按效果付费”模式,在某种程度上是将商业风险转移给了服务方。GEO按排名收费,但排名能否带来真实转化存疑;按交易增长抽成,但增长中多少归因于AI、多少归因于市场环境,难以厘清;直播带货的GMV对赌,则更偏向销售协议而非技术服务合同。

一个根本性的制约在于:没有高度数字化的、标准化的业务流,就没有清晰可计的AI服务单元。这不是单纯的技术问题,而是企业数字化转型深度的直接体现。

这种差距在计费颗粒度上尤为明显。国内企业内部的系统往往五花八门,一个“动作”的颗粒度根本无法统一。如何证明“是AI执行了一个动作”而非“员工手动点击”?除了蚂蚁数科在金融领域提出了相对明确的“万分位到千分位”抽成公式外,大部分场景仍处于“一事一议”的定制化谈判阶段,未能形成可复制、可规模化的标准计费单元。当归因颗粒度不够细时,精细化的商业模式就难以成立。

因此,真正的出路在于回归本质:扎扎实实地补上业务标准化和企业数字化这门必修课。这并非轻松的技术工程,更多是组织、流程、生态层面的“脏活累活”。但正因为其艰巨,才构成了真正的竞争壁垒。

DeepSeek V4是开源的,任何人都可下载部署,连API费用都能省去,这赋予了用户极大的自由度。但反过来看,也意味着厂商与客户之间缺乏深度绑定——没有生态锁定,没有工具链粘性。

打个比方:国内的AI行业,目前主要是在“卖裸电”。客户买到手后,还得自己拉电线、装变压器、修配电房。

V4把电价打到两分钱一度,确实便宜。但商业客户真正需要的,从来不是更便宜的电,而是一个插上插头就能稳定工作的完整供电系统。

若以《Token经济学》的五层栈观之,现阶段,国内AI在第一层(公用事业层)的利润空间已趋近于零。不向上攀登,就只能等待出清。而向上走的第一步,并非发明一个炫酷的新计费名词,也不是空喊“按结果付费”的口号,而是回到最基础的工作:建立可计量、可追溯的数字业务基础设施。

当下,Token的成本在不断下沉,而AI创造的价值却在持续上移。这两条趋势线的交叉点,就是坚实可靠的基础设施。谁能率先抵达那里,谁就能在Token成本无限趋近于零的那一天,依然凭借不可替代的价值,屹立不倒。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多