全免费路线被抛弃,所有AI应用都在转向Anthropic路线。
可能是GPT横空出世后,用户增速过于耀眼,在很长一段时间,无论国内还是国外的AI产品都是模仿它的路线,以免费吸引海量用户,再考虑怎么商业化变现。
然而,GPT自己走着走着就发现这条路行不通,或者说不划算。AI不同于传统互联网,算力需求不是每新增一个用户边际递减,而是用户量越大,调用频率越高,使用场景越复杂,算力消耗的曲线呈指数级攀升。
这种“逆边际成本”结构是整个产业必须面对的结构性约束,行业必须革新商业逻辑,不能再是“先圈地再收割”,而是从一开始就把算力当成核心生产要素来定价,要从“价格战”转入“价值战”。
因此国内AI用户数第一的豆包上线付费订阅,就再正常不过了,甚至,我都觉得它推出的时间有点晚了。
豆包坐拥3.45亿月活,比国内其他家AI应用的用户数加起来还多,算力需求过于恐怖,任何一个人去负责豆包的AI infra都得头皮发麻。须知,谷歌用千亿美元级资本投入、自研TPU生态、万卡级集群支撑的Gemini,全球月活跃用户也不过7.5 亿。
3.45亿月活是豆包的“甜蜜的烦恼”,其中太多基础需求的“浅度用户”,但即便是浅度需求,也不能单纯通过“降智”降低单位请求的算力供给,那会崩了口碑。
而众多“浅度”用户在某种程度上拖累了大众对豆包的专业度心智,以及跟付费意愿更强的专业用户“抢算力”,有限的算力被“浅度用户”消耗,还不能变现;复杂任务和生产力场景,消耗更多算力与推理时间,但用户却无需付费意愿。一根筋变两头堵,从商业逻辑上,是不划算的。
所以通过付费订阅实现需求分层,普通用户常用到的查资料、写基础文案、日常问答、学习辅导等功能,算力需求较少,继续免费;复杂任务和生产力场景,算力需求高,按需付费。这样既能留住海量用户,又能遴选出付费用户,是各家AI应用的通行做法了。
事实上,专注于生产力场景的AI早就建立了收费机制,比如Anthropic的Claude,以及Gemini、GPT都是免费版+订阅模式。甚至,订阅费都在上涨,Anthropic旗下企业级产品Claude Enterprise就在月费基础上,额外按实际消耗的算力付费。
国内方面,自2026年2月以来,智谱已连续三次上调模型定价, GLM-5.1发布时再度提价10%,结果是2026年第一季度API调用定价提升83%,但调用量仍然增长400%,呈现“量价齐升”的态势。Kimi也是,会员体系最低档从 9.9元起迭代为49元,最高档到699元/月,并引入Agent集群权限等差异化增值。
它们据此反而在专业用户群体建立了“专业心智”,建造了商业飞轮的雏形。
豆包的付费订阅,虽迟但到,还没设阶梯收费的国产AI应用,迟早也会跟进。然而,订阅模式也只是起点,AI的终局,应该是一门看“交付结果”的生意。
01
有趣的是,就在豆包酝酿收费的几天前,DeepSeek刚刚完成了一场令行业瞠目的降价,4月25日,V4-Pro宣布价格暴降75%,输入价格(缓存未命中)降至3元/百万Tokens,输出价格降至6元。
仅隔一天,V4-Pro再次加码,缓存命中价格直接打到0.025元/百万Tokens——两分钱。与此同时,V4-Flash的缓存命中价格更低,跌至0.02元/百万Tokens。
对比GPT-5.5的$2.5/百万Tokens,和Claude Opus 4.7的$15/百万Tokens,这样的价格,几乎就是白送。
但低价,真的意味着商业上的胜利吗?
仍以豆包为例,在商业模式上,当下字节做出的选择,是SaaS订阅。这条路最保守,也最安全。
问题是,将SaaS订阅套在AI产品身上,本质上仍然是在为用户消耗的Token买单——无论包装成“标准版”还是“专业版”,底层的成本核算逻辑并没有变:用户多用一次模型,平台就多烧一份算力。
回想2024年的那场大模型价格战,阿里云通义千问主力模型直降97%,百度直接宣布免费,整个行业陷入一场”谁比谁更便宜”的竞赛。当时有人欢呼“大模型进入厘时代”。
当时就有人冷静指出:当所有玩家都挤在同一个计量单位上互相压价,负毛利就不是意外,而是结构性的终点。
两年过去了,V4把地板又凿穿了一层,但游戏规则没有任何变化。
腾讯科技前段时间出了一篇名为《Token经济学》的深度分析,提供了一个值得重视的观察框架:当前的AI商业化,早已不再是一道“Token单价”的算术题。不同的任务类型里检索、推理、长时运行、多轮交互,对应着完全不同的成本结构。
一个轻量检索任务,搜索和grounding的费用可能是Token本身的四十倍;一个重度编程session,模型推理成本才是大头。根本不存在一张通用的“AI单位成本表”。
换句话说,“谁的Token更便宜”这个问题本身,已经是一个过时的提法。它默认了行业存在一个统一的计量单位,而现实是,计费对象正在裂变,价格维度正在扩散,Token只是其中最底层的那一片。
《Token经济学》给出了一个五层结算栈的框架来理解这种变化:最底层是公用事业层,算力、Token、缓存、搜索,可计量、可路由,本质上和水电煤没有区别;往上是协议与能力层,包括MCP、A2A等跨平台互操作接口;再往上是知识封装层,涵盖Prompt、Eval、Memory这些行业know-how的序列化;第四层是执行交付层,Agent作为被托管、被监控“数字劳动力”来运作;最顶层是结果与责任层,按outcome收费,“结果”本身变成合同化的结算对象。
V4降价,本质上是把第一层的公用事业价格打到了接近免费。但国内厂商的商业模式,几乎完全压在这一层上。
从这个角度看,豆包的这次收费还是只在第一层推进,是“只有价格可以打”的主动防御型策略。
02
当国内还在围绕Token单价缠斗的时候,大洋彼岸的AI商业,已经走到了一个完全不同的阶段,具体来说,这是三条轨道并行演进的路线,各有各的前提条件,也各有各的生长逻辑。
第一条轨道最激进,也最引人注目,即按结果付费。
以Intercom的AI客服产品Fin为例,其定价$0.99/单次服务,只在AI真正解决了客户问题时才收费。什么算“解决”?要么客户主动确认问题已处理,要么客户在Fin回复后没有继续追问。这个定义被写进了系统规则,不依赖人的主观判断,不存在归因争议。
Fin目前每周处理超过100万次客服对话,Intercom也借此把AI相关营收从几乎为零拉到了过亿美元的量级。Zendesk走的是同一条路,但更稳健,按自动解决工单收费,承诺量$1.50/单次服务,按需使用$2.00/单次服务。
Sierra AI则更为高调,由OpenAI董事长Bret Taylor联合创办,从第一天起就完全基于outcome定价,企业合同价格区间在$50K到$200K/年不等,21个月做到超过$150M的ARR,目前服务于超过40%的财富50强企业,最近刚以$15B估值融了$9.5亿美元。
第二条轨道务实得多,即按动作消耗。
Salesforce的Agentforce没有一刀切到“按结果”,而是推出了Flex Credits体系:每个AI action消耗20 credits,折合$0.10/action。每个action覆盖最多10,000 Tokens的处理量,企业按$500/100,000 credits的单位批量采购。与此同时,客户面向的Agent仍然保留了$2/conversation的按对话计费选项,Copilot类产品则维持传统的席位制。三种模式并存,企业可以根据自己的工作负载选择最合适的计价方式。
第三条轨道最保守,即混合订阅。
ServiceNow的Now Assist把AI能力打包进企业级License,基础报价在$150K-$400K/年,AI功能作为附加模块叠加,形成“固定底座+用量超额”的混合结构。这条路之所以能走通,是因为ServiceNow的客户已经深度绑定在它的ITSM生态里,替换成本极高,AI只是在已有护城河上加了一层。
三条轨道的差异,表面上是计费方式不同,深层是计费单元不同。第一条轨道计的是“已完成的工作”,第二条计的是“已执行的动作”,第三条计的是“已占用的席位和平台”。
但它们有一个共同的前提是无论计什么,被计的那个东西都必须在系统里有清晰的定义、可被自动记录、且双方对其含义没有争议。
把这个逻辑放回五层结算栈的框架里,会看到一个非常清晰的路径:国外最新的AI商业模式并不是单纯地只计算Token消耗量,而是先把计费单元从Token升级为Action(第二、三层),再从Action升级为Outcome(第五层)。这是一个分阶段的基础设施建设过程,每一级台阶都有对应的系统能力作为支撑。
由此可见,与国内“按Token计费”的模式相比,这样更多元、更精准的商业模式,无疑更切合当下众多B端用户的痛点,因为归根结底,用户在乎的是工作的结果,而非消耗的Token。
03
看到上述对比,可能有人会说:国外AI厂商在商业上的成功,很大程度上要归功于海外B端用户更充足的预算,以及更强的付费意愿。
这么想虽然也没错,毕竟从数据来看,2025年美国四大科技巨头(微软、谷歌、亚马逊、Meta)的AI资本开支加起来约2.5万亿人民币,而中国七家头部互联网大厂总共才投了6300亿,连人家的四分之一都不到。
但问题是:国外厂商的“按结果付费”等商业模式,之所以在中国难以践行,一个更重要的原因是:中国的商业活动,效果太难定义,场景太碎。
Intercom敢按单次服务收费,是因为Zendesk们花了十几年时间,把“客户工单”这件事硬化成了一套完整的系统流程,开单、流转、升级、关单,每一步都有日志,每一步都可追溯。Salesforce敢按action收费,是因为它自己就是CRM系统——它清楚地知道“发一封邮件”“更新一条记录”“创建一个机会”是什么,系统有原子级的操作日志。这些计费模式不是“商业模式创新”拍脑袋想出来的,它们是在成熟的业务基础设施之上,自然生长出来的。
而在中国,就算是客服这样看似高度“标准化”的场景,其实也隐藏着一连串“碎片化”的信息孤岛。
2025年,中国智能客服的市场渗透率已经突破85%, 但问题是,这85%的渗透率背后,是十几条互不打通的渠道在各自为战。淘宝、京东、抖音、微信、小红书、小程序、电话、钉钉、企微……每个平台都有自己的后台,客服人员得同时监控一堆窗口,信息完全无法互通。
一个客户可能在抖音上问了“这衣服有没有L码”,客服回了“有”;然后这客户又跑去微信私域问“刚才那件衣服能便宜点吗”,另一个客服接了;最后客户可能还在小红书私信里吐槽”发货太慢”。
这三个对话,在企业的系统里可能是三条完全独立的记录,甚至可能根本没有记录,尤其是微信私域里的聊天,很多就躺在销售个人手机上。
如果说国外的AI商业化正在沿着五层结算栈逐级上移,那么国内的状况是:第一层的地板已经被打穿,但第二到第五层之间,却连台阶都还没有修好。
尽管国内确实有人在搞按结果付费,但跟国外那套“解决一个工单收多少钱”的玩法相比,中国的版本更像是“效果营销”的变种,而不是真正的AI服务计费革命。
目前国内这类效仿“按结果付费”的模式中,最成气候的是GEO(生成式引擎优化)这个赛道。说白了就是帮企业优化在豆包、DeepSeek、Kimi这些AI搜索里的品牌曝光,然后按效果收钱,即品牌被AI推荐到第几位、排名提升了多少,对应不同收费档位。
而在金融和营销领域,也有部分企业开始了类似的尝试。
例如国内的蚂蚁数科,就激进地提出了银行只要提供业务目标、预算和客群,智能体自动平衡全链路,最后按交易规模增长净值的万分位到千分位收费。
同样地,在数字人直播领域,中科深智从2024年底就开始跟电商客户试水分润模式,到2025年正式推出AI RaaS业务,跟客户约定:素材投不出去不收钱,ROI没达标按比例退费。
但如果细究下来,国内的AI按结果付费,目前更像是营销外包的效果对赌,而不是AI服务的标准化计费革命。
04
现阶段,国内的”按效果付费”,更多是把商业风险转移给客户——GEO优化按排名收费,但排名能不能带来真实转化,没人打包票;蚂蚁数科按交易增长收费,但增长里有多少是AI的功劳、多少是市场环境的功劳,归因扯不清;而直播带货的GMV,则更像是一种销售对赌,而非技术服务。
没有数字化的工单,就没有AI服务的计费单元。这不是AI技术本身能解决的问题,而是企业数字化转型深度的映射。
这样的具体差距,在计费颗粒度上,体现得尤为明显。国内企业面对的现实是:内部系统五花八门,一个“动作”的颗粒度根本没法统一。你怎么证明“AI做了一个动作”而不是“员工手动点了一下”?
目前,国内除了蚂蚁数科,在金融行业做出了相对明确的“万分位到千分位”抽成公式外,大部分企业还停留在“一事一议”的定制化谈判阶段,没有形成可复制的标准化计费单元。
当归因颗粒度不够细的时候,这样的商业模式就难以成立。
所以,真正的正道,扎扎实实地将业务标准化、企业数字化的这些课补上去。
这并不是一个轻松的工程,它们并非技术上的难题,更多是组织层面、流程层面、生态层面的脏活累活。但正因为脏、正因为累,才构成了真正的壁垒。
DeepSeek V4是开源的,任何人都可以下载部署,连API费用都可以省掉,这当然是巨大的自由度。但反过来看,也意味着厂商和客户之间几乎没有绑定关系——没有生态锁定,没有工具链粘性,
做个比喻的话:国内的AI,现在卖的是裸电。客户拿到手,还得自己拉电线、装变压器、修配电房。
V4把电价打到了两分钱一度,确实很便宜。但商业客户真正需要的不是更便宜的电,而是一个插上插头就能用的完整供电系统。
若按照先前《Token经济学》的分法,现阶段,国内AI在第一层的利润空间已经趋近于零,不往上走,就只能等着被出清。而往上走的第一步,不是发明一个新的计费模式,不是喊一句“按结果付费”的口号,而是回到最基本的建立可计量的数字基础设施。
当下,Token的成本在下沉,AI的价值却在上移。这两条线的交叉点,就是基础设施。谁先到达那里,谁就能在Token成本归零的那一天,依然站着收钱。
本文来自转载微信公众号 “最话FunTalk”(ID:iFuntalker) ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

微信扫一扫

