Token单价已死，交付结果当立

用户只在乎工作结果，而非Token

全免费路线被抛弃，所有AI应用都在转向Anthropic路线。

可能是GPT横空出世后，用户增速过于耀眼，在很长一段时间，无论国内还是国外的AI产品都是模仿它的路线，以免费吸引海量用户，再考虑怎么商业化变现。

然而，GPT自己走着走着就发现这条路行不通，或者说不划算。AI不同于传统互联网，算力需求不是每新增一个用户边际递减，而是用户量越大，调用频率越高，使用场景越复杂，算力消耗的曲线呈指数级攀升。

这种“逆边际成本”结构是整个产业必须面对的结构性约束，行业必须革新商业逻辑，不能再是“先圈地再收割”，而是从一开始就把算力当成核心生产要素来定价，要从“价格战”转入“价值战”。

因此国内AI用户数第一的豆包上线付费订阅，就再正常不过了，甚至，我都觉得它推出的时间有点晚了。

豆包坐拥3.45亿月活，比国内其他家AI应用的用户数加起来还多，算力需求过于恐怖，任何一个人去负责豆包的AI infra都得头皮发麻。须知，谷歌用千亿美元级资本投入、自研TPU生态、万卡级集群支撑的‌Gemini，全球月活跃用户也不过7.5 亿‌。

3.45亿月活是豆包的“甜蜜的烦恼”，其中太多基础需求的“浅度用户”，但即便是浅度需求，也不能单纯通过“降智”降低单位请求的算力供给，那会崩了口碑。

而众多“浅度”用户在某种程度上拖累了大众对豆包的专业度心智，以及跟付费意愿更强的专业用户“抢算力”，有限的算力被“浅度用户”消耗，还不能变现；复杂任务和生产力场景，消耗更多算力与推理时间，但用户却无需付费意愿。一根筋变两头堵，从商业逻辑上，是不划算的。

所以通过付费订阅实现需求分层，普通用户常用到的查资料、写基础文案、日常问答、学习辅导等功能，算力需求较少，继续免费；复杂任务和生产力场景，算力需求高，按需付费。这样既能留住海量用户，又能遴选出付费用户，是各家AI应用的通行做法了。

事实上，专注于生产力场景的AI早就建立了收费机制，比如Anthropic的Claude，以及Gemini、GPT都是免费版+订阅模式。甚至，订阅费都在上涨，Anthropic旗下企业级产品Claude Enterprise就在月费基础上，额外按实际消耗的算力付费。

国内方面，自2026年2月以来，智谱已连续三次上调模型定价， GLM-5.1发布时再度提价10%，结果是2026年第一季度API调用定价提升83%，但调用量仍然增长400%，呈现“量价齐升”的态势。Kimi也是，会员体系最低档从 9.9元起迭代为49元，最高档到699元/月，并引入Agent集群权限等差异化增值。

它们据此反而在专业用户群体建立了“专业心智”，建造了商业飞轮的雏形。

豆包的付费订阅，虽迟但到，还没设阶梯收费的国产AI应用，迟早也会跟进。然而，订阅模式也只是起点，AI的终局，应该是一门看“交付结果”的生意。

01

有趣的是，就在豆包酝酿收费的几天前，DeepSeek刚刚完成了一场令行业瞠目的降价，4月25日，V4-Pro宣布价格暴降75%，输入价格（缓存未命中）降至3元/百万Tokens，输出价格降至6元。

仅隔一天，V4-Pro再次加码，缓存命中价格直接打到0.025元/百万Tokens——两分钱。与此同时，V4-Flash的缓存命中价格更低，跌至0.02元/百万Tokens。

对比GPT-5.5的$2.5/百万Tokens，和Claude Opus 4.7的$15/百万Tokens，这样的价格，几乎就是白送。

但低价，真的意味着商业上的胜利吗？

仍以豆包为例，在商业模式上，当下字节做出的选择，是SaaS订阅。这条路最保守，也最安全。

问题是，将SaaS订阅套在AI产品身上，本质上仍然是在为用户消耗的Token买单——无论包装成“标准版”还是“专业版”，底层的成本核算逻辑并没有变：用户多用一次模型，平台就多烧一份算力。

回想2024年的那场大模型价格战，阿里云通义千问主力模型直降97%，百度直接宣布免费，整个行业陷入一场”谁比谁更便宜”的竞赛。当时有人欢呼“大模型进入厘时代”。

当时就有人冷静指出：当所有玩家都挤在同一个计量单位上互相压价，负毛利就不是意外，而是结构性的终点。

两年过去了，V4把地板又凿穿了一层，但游戏规则没有任何变化。

腾讯科技前段时间出了一篇名为《Token经济学》的深度分析，提供了一个值得重视的观察框架：当前的AI商业化，早已不再是一道“Token单价”的算术题。不同的任务类型里检索、推理、长时运行、多轮交互，对应着完全不同的成本结构。

一个轻量检索任务，搜索和grounding的费用可能是Token本身的四十倍；一个重度编程session，模型推理成本才是大头。根本不存在一张通用的“AI单位成本表”。

换句话说，“谁的Token更便宜”这个问题本身，已经是一个过时的提法。它默认了行业存在一个统一的计量单位，而现实是，计费对象正在裂变，价格维度正在扩散，Token只是其中最底层的那一片。

《Token经济学》给出了一个五层结算栈的框架来理解这种变化：最底层是公用事业层，算力、Token、缓存、搜索，可计量、可路由，本质上和水电煤没有区别；往上是协议与能力层，包括MCP、A2A等跨平台互操作接口；再往上是知识封装层，涵盖Prompt、Eval、Memory这些行业know-how的序列化；第四层是执行交付层，Agent作为被托管、被监控“数字劳动力”来运作；最顶层是结果与责任层，按outcome收费，“结果”本身变成合同化的结算对象。

V4降价，本质上是把第一层的公用事业价格打到了接近免费。但国内厂商的商业模式，几乎完全压在这一层上。

从这个角度看，豆包的这次收费还是只在第一层推进，是“只有价格可以打”的主动防御型策略。

02

当国内还在围绕Token单价缠斗的时候，大洋彼岸的AI商业，已经走到了一个完全不同的阶段，具体来说，这是三条轨道并行演进的路线，各有各的前提条件，也各有各的生长逻辑。

第一条轨道最激进，也最引人注目，即按结果付费。

以Intercom的AI客服产品Fin为例，其定价$0.99/单次服务，只在AI真正解决了客户问题时才收费。什么算“解决”？要么客户主动确认问题已处理，要么客户在Fin回复后没有继续追问。这个定义被写进了系统规则，不依赖人的主观判断，不存在归因争议。

Fin目前每周处理超过100万次客服对话，Intercom也借此把AI相关营收从几乎为零拉到了过亿美元的量级。Zendesk走的是同一条路，但更稳健，按自动解决工单收费，承诺量$1.50/单次服务，按需使用$2.00/单次服务。

Sierra AI则更为高调，由OpenAI董事长Bret Taylor联合创办，从第一天起就完全基于outcome定价，企业合同价格区间在$50K到$200K/年不等，21个月做到超过$150M的ARR，目前服务于超过40%的财富50强企业，最近刚以$15B估值融了$9.5亿美元。

第二条轨道务实得多，即按动作消耗。

Salesforce的Agentforce没有一刀切到“按结果”，而是推出了Flex Credits体系：每个AI action消耗20 credits，折合$0.10/action。每个action覆盖最多10,000 Tokens的处理量，企业按$500/100,000 credits的单位批量采购。与此同时，客户面向的Agent仍然保留了$2/conversation的按对话计费选项，Copilot类产品则维持传统的席位制。三种模式并存，企业可以根据自己的工作负载选择最合适的计价方式。

Token单价已死，交付结果当立

第三条轨道最保守，即混合订阅。

ServiceNow的Now Assist把AI能力打包进企业级License，基础报价在$150K-$400K/年，AI功能作为附加模块叠加，形成“固定底座+用量超额”的混合结构。这条路之所以能走通，是因为ServiceNow的客户已经深度绑定在它的ITSM生态里，替换成本极高，AI只是在已有护城河上加了一层。

三条轨道的差异，表面上是计费方式不同，深层是计费单元不同。第一条轨道计的是“已完成的工作”，第二条计的是“已执行的动作”，第三条计的是“已占用的席位和平台”。

但它们有一个共同的前提是无论计什么，被计的那个东西都必须在系统里有清晰的定义、可被自动记录、且双方对其含义没有争议。

把这个逻辑放回五层结算栈的框架里，会看到一个非常清晰的路径：国外最新的AI商业模式并不是单纯地只计算Token消耗量，而是先把计费单元从Token升级为Action（第二、三层），再从Action升级为Outcome（第五层）。这是一个分阶段的基础设施建设过程，每一级台阶都有对应的系统能力作为支撑。

由此可见，与国内“按Token计费”的模式相比，这样更多元、更精准的商业模式，无疑更切合当下众多B端用户的痛点，因为归根结底，用户在乎的是工作的结果，而非消耗的Token。

03

看到上述对比，可能有人会说：国外AI厂商在商业上的成功，很大程度上要归功于海外B端用户更充足的预算，以及更强的付费意愿。

这么想虽然也没错，毕竟从数据来看，2025年美国四大科技巨头（微软、谷歌、亚马逊、Meta）的AI资本开支加起来约2.5万亿人民币，而中国七家头部互联网大厂总共才投了6300亿，连人家的四分之一都不到。

但问题是：国外厂商的“按结果付费”等商业模式，之所以在中国难以践行，一个更重要的原因是：中国的商业活动，效果太难定义，场景太碎。

Intercom敢按单次服务收费，是因为Zendesk们花了十几年时间，把“客户工单”这件事硬化成了一套完整的系统流程，开单、流转、升级、关单，每一步都有日志，每一步都可追溯。Salesforce敢按action收费，是因为它自己就是CRM系统——它清楚地知道“发一封邮件”“更新一条记录”“创建一个机会”是什么，系统有原子级的操作日志。这些计费模式不是“商业模式创新”拍脑袋想出来的，它们是在成熟的业务基础设施之上，自然生长出来的。

而在中国，就算是客服这样看似高度“标准化”的场景，其实也隐藏着一连串“碎片化”的信息孤岛。

2025年，中国智能客服的市场渗透率已经突破85%，但问题是，这85%的渗透率背后，是十几条互不打通的渠道在各自为战。淘宝、京东、抖音、微信、小红书、小程序、电话、钉钉、企微……每个平台都有自己的后台，客服人员得同时监控一堆窗口，信息完全无法互通。

一个客户可能在抖音上问了“这衣服有没有L码”，客服回了“有”；然后这客户又跑去微信私域问“刚才那件衣服能便宜点吗”，另一个客服接了；最后客户可能还在小红书私信里吐槽”发货太慢”。

这三个对话，在企业的系统里可能是三条完全独立的记录，甚至可能根本没有记录，尤其是微信私域里的聊天，很多就躺在销售个人手机上。

如果说国外的AI商业化正在沿着五层结算栈逐级上移，那么国内的状况是：第一层的地板已经被打穿，但第二到第五层之间，却连台阶都还没有修好。

Token单价已死，交付结果当立