产业资讯

Token单价已死，交付结果当立：2024年AI服务价值评估与选择指南

2026-05-16

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

AI行业正告别免费模式，转向付费订阅等商业路径。因算力成本激增，“先圈地后收割”逻

全免费的时代正在落幕，AI行业正集体转向一条更现实的商业道路。

回想GPT刚问世时，用户增长的曲线实在太过耀眼，以至于很长一段时间里，无论国内国外，几乎所有AI产品都遵循着同一个剧本：先用免费吸引海量用户，把盘子做大，再琢磨怎么赚钱。这几乎是互联网时代的金科玉律。

然而，AI的物理规律和互联网截然不同。算力消耗并非随着用户增加而边际递减，恰恰相反，用户越多、调用越频繁、任务越复杂，算力需求是指数级攀升的。这是一种“逆边际成本”结构，是整个行业必须面对的根本性约束。

这意味着，传统的“先圈地、后收割”逻辑在AI领域行不通了。算力本身就是核心的生产资料，必须被纳入定价体系。行业的竞争焦点，正从“价格战”转向“价值战”。

理解了这一点，再看国内月活用户数第一的豆包推出付费订阅，就显得顺理成章，甚至可以说，这一步来得有些迟了。

3.45亿的月活用户，这个数字比国内其他主流AI应用的用户总和还要多。如此庞大的用户基数带来的算力需求，对任何负责基础设施的团队而言，都是巨大的挑战。要知道，即便是背靠谷歌千亿美元资本、自研TPU生态、拥有万卡级集群支撑的Gemini，其全球月活用户也不过7.5亿。

海量用户是甜蜜的负担。其中大量是进行基础查询、简单问答的“浅度用户”。即便需求简单，也不能通过降低模型响应质量来节省算力，那无异于自毁口碑。然而，正是这些免费且高频的浅度需求，在某种程度上消耗着宝贵的算力资源，同时也模糊了产品在专业用户心中的心智定位——他们更复杂、更消耗算力的生产力需求，反而被淹没其中。

因此，通过付费订阅进行需求分层，就成了必然选择。将查资料、基础文案、日常问答等算力需求低的功能保留免费，面向复杂任务和生产力场景提供更强大的付费服务。这既能维持基本盘，又能筛选出高价值用户。事实上，这已是全球AI应用的通行做法：从Anthropic的Claude，到谷歌的Gemini，再到OpenAI的GPT，都采用了“免费+订阅”的混合模式。不仅如此，订阅费用还在普遍上涨，Anthropic甚至为企业级客户引入了按实际算力消耗付费的机制。

国内趋势同样明显。自2026年2月以来，智谱已连续三次上调其模型API定价，最新发布的GLM-5.1再度提价10%。结果是，2026年第一季度其API调用均价提升了83%，但调用量却逆势增长了400%，呈现“量价齐升”。Kimi的会员体系也从最低档9.9元迭代至49元起，最高档达699元/月，并引入了Agent集群权限等差异化增值服务。

这些举措非但没有吓退用户，反而在专业群体中建立了更强的“专业心智”，初步形成了商业飞轮。豆包的付费订阅，只是一个开始。尚未设立阶梯收费的国产AI应用，跟进只是时间问题。然而，订阅模式远非终点。AI商业的终局，很可能是一门为“交付结果”定价的生意。

01 价格战的红海与商业模式的困局

一个有趣的对比是，就在豆包酝酿收费的几天前，DeepSeek进行了一场令行业侧目的降价。4月25日，其V4-Pro模型价格暴降75%，输入价格降至3元/百万Tokens，输出价格降至6元。次日，该模型缓存命中价格更是降至惊人的0.025元/百万Tokens。与此同时，V4-Flash的缓存命中价格低至0.02元/百万Tokens。

对比GPT-5.5的2.5美元/百万Tokens和Claude Opus 4.7的15美元/百万Tokens，这个价格几乎等同于白送。

但低价，真的意味着商业上的胜利吗？

以豆包选择的SaaS订阅模式为例，这条路看似保守却稳妥。然而，将SaaS模式套用在AI产品上，其本质依然是在为消耗的Token（模型处理的基本单位）买单。无论包装成“标准版”还是“专业版”，底层的成本核算逻辑并未改变：用户多用一次，平台就多烧一份算力。

这让人想起2024年那场席卷行业的大模型价格战。当时，阿里云通义千问主力模型价格直降97%，百度更是宣布部分模型免费，整个行业陷入“谁比谁更便宜”的内卷。当时就有观点指出：当所有玩家都挤在同一个计量单位上竞相压价，行业性的负毛利就不是意外，而是结构性的必然终点。

两年过去了，V4将价格地板又凿穿了一层，但游戏规则本身并未改变。

近期一篇名为《Token经济学》的深度分析，提供了一个关键的观察视角：当前的AI商业化，早已不是一道简单的“Token单价”算术题。不同的任务类型——轻量检索、复杂推理、长时运行、多轮交互——对应着完全不同的成本结构。一个轻量检索任务中，搜索和知识库查询的成本可能是Token本身的数十倍；而在一个重度编程会话中，模型推理成本才是大头。根本不存在一张通用的“AI单位成本表”。

换句话说，“谁的Token更便宜”这个问题本身已经过时了。它预设了一个统一的计量单位，而现实是，计费对象正在快速裂变，价格维度正在扩散，Token只是其中最底层、最基础的一环。

《Token经济学》提出了一个五层结算栈的框架来理解这种演进：

最底层是公用事业层：包括算力、Token、缓存、搜索等，可计量、可路由，如同水电煤。
往上是协议与能力层：涵盖MCP、A2A等跨平台互操作接口。
再往上是知识封装层：包括Prompt（提示词）、Eval（评估）、Memory（记忆）等行业经验的序列化封装。
第四层是执行交付层：Agent作为被托管、被监控的“数字劳动力”运作。
最顶层是结果与责任层：按最终产出（Outcome）收费，“结果”本身成为合同化的结算对象。

V4的降价，本质上是将第一层（公用事业层）的价格打到了接近免费。而目前国内多数厂商的商业模式，几乎完全压在这一层上竞争。从这个角度看，豆包的收费尝试，依然是在第一层内部进行的策略调整，是一种“只能在价格上做文章”的主动防御。

02 三条轨道：海外AI商业化的进阶之路

当国内厂商仍在Token单价的红海中缠斗时，大洋彼岸的AI商业化，已经沿着三条清晰的轨道并行演进，各自的前提和逻辑截然不同。

第一条轨道最为激进：按结果付费（Outcome-based Pricing）。

典型代表是Intercom的AI客服产品Fin，其定价为0.99美元/次，但只在AI真正解决了客户问题时才收费。何为“解决”？要么客户主动确认问题已处理，要么客户在AI回复后未继续追问。这套规则被写入系统，不依赖主观判断。Fin每周处理超100万次对话，帮助Intercom将AI相关营收拉升至过亿美元量级。Zendesk路径类似但更稳健，按自动解决的工单收费。

更引人注目的是Sierra AI，由OpenAI董事长Bret Taylor联合创办，从创立第一天起就完全基于结果定价，企业合同价格在5万到20万美元/年不等，仅用21个月ARR（年度经常性收入）就突破1.5亿美元，服务于超40%的财富50强企业，近期以150亿美元估值融资95亿美元。

第二条轨道更为务实：按动作消耗（Action-based Consumption）。

Salesforce的Agentforce没有一刀切地采用“按结果”模式，而是推出了Flex Credits体系：每个AI动作消耗20 credits（约合0.1美元），可覆盖最多1万Tokens的处理量。企业按500美元/10万credits批量采购。同时，系统仍保留按对话（2美元/次）计费选项，Copilot类产品则维持传统的席位制。三种模式并存，企业可根据自身负载灵活选择。

第三条轨道最为保守：混合订阅（Hybrid Subscription）。

ServiceNow的Now Assist将AI能力打包进企业级License，基础报价在15万至40万美元/年，AI功能作为附加模块叠加，形成“固定底座+超额用量”的混合结构。这条路能走通，得益于ServiceNow的客户已深度绑定在其ITSM（IT服务管理）生态中，替换成本极高，AI只是在现有护城河上增加了一层价值。

三条轨道的差异，表面是计费方式不同，深层是计费单元的升级。第一条计的是“已完成的工作”，第二条计的是“已执行的动作”，第三条计的是“已占用的席位和平台能力”。

但它们共享一个核心前提：无论计费单元是什么，都必须能在系统中有清晰定义、可被自动记录、且双方对其含义无争议。

将这个逻辑放回五层结算栈的框架，路径非常清晰：海外领先的AI商业模式并非只计算Token，而是先将计费单元从Token升级为Action（对应第二、三层），再进一步升级为Outcome（第五层）。这是一个分阶段的基础设施建设过程，每一级台阶都有对应的系统能力作为支撑。

由此可见，与国内仍聚焦于“按Token计费”的模式相比，这种更多元、更精准的商业模式，无疑更契合B端用户的根本诉求：用户最终为工作成果买单，而非为消耗的中间资源付费。

03 中国的现实：缺失的台阶与碎片化的战场

看到上述对比，一个常见的观点是：海外AI商业的成功，得益于其B端用户更充足的预算和更强的付费意愿。数据似乎支持这一点：2025年，美国四大科技巨头（微软、谷歌、亚马逊、Meta）的AI资本开支合计约2.5万亿软妹币，而中国七家头部互联网大厂的投入总和约为6300亿，不足前者的四分之一。

然而，将“按结果付费”等模式在中国难以推行的原因，仅仅归结为预算差异，可能过于简单。一个更深层、更关键的原因是：在中国的商业环境中，“效果”本身往往难以清晰定义，应用场景也高度碎片化。

Intercom敢按单次服务收费，是因为Zendesk等公司花了十几年时间，将“客户工单”硬化为一套完整的、可追溯的系统流程。Salesforce敢按Action收费，是因为它自身就是CRM系统，对“发邮件”、“更新记录”等原子操作有清晰的日志定义。这些计费模式并非凭空创新的商业模式，而是建立在成熟的、数字化的业务基础设施之上。

反观中国，即便是客服这类看似标准化的场景，背后也隐藏着大量“信息孤岛”。

2025年，中国智能客服市场渗透率已超85%，但这85%的背后，是淘宝、京东、抖音、微信、小红书、小程序、电话、钉钉、企业微信等十多个互不连通的渠道在各自为战。客服需要同时监控多个后台，信息无法互通。一个客户可能在抖音咨询尺码，在微信询价，又在小红书吐槽发货慢——这三段对话在企业侧可能是三条独立记录，甚至根本没有进入系统（尤其是微信私域聊天，可能只存在于销售个人手机）。

如果说海外的AI商业化正在沿着五层结算栈逐级上移，那么国内的现状是：第一层（公用事业层）的价格地板已被击穿，但第二层到第五层之间，连稳固的“台阶”都尚未修好。

尽管国内也有“按效果付费”的尝试，但与海外“解决一个工单收一份钱”的模式相比，中国的版本更像“效果营销”的变体，而非AI服务的标准化计费革命。

目前，国内最成气候的类似模式是GEO（生成式引擎优化）赛道，即帮助企业优化在豆包、DeepSeek、Kimi等AI搜索中的品牌曝光排名，并按排名提升效果收费。在金融和营销领域也有零星尝试，例如蚂蚁数科提出，银&行只需提供业务目标、预算和客群，智能体自动执行全链路，最终按交易规模增长的净值以万分位到千分位抽成。

同样，在数字人直播领域，中科深智从2024年底开始与电商客户尝试分润模式，2025年正式推出AI RaaS业务，约定素材投不出去不收费，ROI未达标按比例退费。

但细究之下，国内的“按结果付费”，目前更接近于营销外包的效果对赌协议，其计费单元（如排名、GMV）与AI服务过程本身的关联度较弱，归因模糊，尚未形成标准化的AI服务计费单元。

04 正道：补上数字化与标准化的课

现阶段，国内的“按效果付费”模式，在某种程度上是将商业风险转移给了服务方。GEO按排名收费，但排名能否带来真实转化存疑；按交易增长抽成，但增长中多少归因于AI、多少归因于市场环境，难以厘清；直播带货的GMV对赌，则更偏向销售协议而非技术服务合同。

一个根本性的制约在于：没有高度数字化的、标准化的业务流，就没有清晰可计的AI服务单元。这不是单纯的技术问题，而是企业数字化转型深度的直接体现。

这种差距在计费颗粒度上尤为明显。国内企业内部的系统往往五花八门，一个“动作”的颗粒度根本无法统一。如何证明“是AI执行了一个动作”而非“员工手动点击”？除了蚂蚁数科在金融领域提出了相对明确的“万分位到千分位”抽成公式外，大部分场景仍处于“一事一议”的定制化谈判阶段，未能形成可复制、可规模化的标准计费单元。当归因颗粒度不够细时，精细化的商业模式就难以成立。

因此，真正的出路在于回归本质：扎扎实实地补上业务标准化和企业数字化这门必修课。这并非轻松的技术工程，更多是组织、流程、生态层面的“脏活累活”。但正因为其艰巨，才构成了真正的竞争壁垒。

DeepSeek V4是开源的，任何人都可下载部署，连API费用都能省去，这赋予了用户极大的自由度。但反过来看，也意味着厂商与客户之间缺乏深度绑定——没有生态锁定，没有工具链粘性。

打个比方：国内的AI行业，目前主要是在“卖裸电”。客户买到手后，还得自己拉电线、装变压器、修配电房。

V4把电价打到两分钱一度，确实便宜。但商业客户真正需要的，从来不是更便宜的电，而是一个插上插头就能稳定工作的完整供电系统。

若以《Token经济学》的五层栈观之，现阶段，国内AI在第一层（公用事业层）的利润空间已趋近于零。不向上攀登，就只能等待出清。而向上走的第一步，并非发明一个炫酷的新计费名词，也不是空喊“按结果付费”的口号，而是回到最基础的工作：建立可计量、可追溯的数字业务基础设施。

当下，Token的成本在不断下沉，而AI创造的价值却在持续上移。这两条趋势线的交叉点，就是坚实可靠的基础设施。谁能率先抵达那里，谁就能在Token成本无限趋近于零的那一天，依然凭借不可替代的价值，屹立不倒。

来源：互联网

上一篇 2024年Codex深度测评：超越ChatGPT的实用指南 下一篇 全球20亿设备告急：Mythos 5天攻破苹果最强硬件防线

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

Token单价已死，交付结果当立：2024年AI服务价值评估与选择指南

摘要

01 价格战的红海与商业模式的困局

02 三条轨道：海外AI商业化的进阶之路

03 中国的现实：缺失的台阶与碎片化的战场

04 正道：补上数字化与标准化的课

相关文章推荐