大模型价格战背后，真正稀缺的不是Token

图片由AI生成

文丨上海期智研究院研究员李彪

编辑丨李海伦

Anthropic在四月初发布Mythos，距离现在已经近一个月。行业内对于它的讨论，更多的关注点在于“它有多强”，但我更想聊聊它的“发布方式”。

到2026年，Token已经不只是一个“多少钱一百万”的计价单位。越往前沿模型走，真正重要的可能不是价格表，而是谁能先用、谁被邀请、谁被限制、谁只能等待开放。

Mythos的发布方式，为我们提供了一个观察AI经济结构的切口：当模型能力进入最前沿区间，价格不再只是价格，“准入”本身也成了价格体系的一部分。

据官方介绍，Mythos并没有像普通模型那样面向市场公开发售，而是被放进了 Anthropic的 “Project Glasswing（玻璃翼计划）” 框架。它的特殊之处在于，进入框架的参与者，仍然可以通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry调用模型；而真正被限制的，是谁能获得这个入口。

Project Glasswing的首批阵容包括12家launch partners，并向40余家构建或维护关键软件基础设施的组织开放 Mythos Preview 访问权限。

这背后是一套正在重写AI市场规则的逻辑——在前沿这一层，价格已经不是唯一门槛。这里的顺序变成了：先被允许进入，再谈调用成本。

Anthropic给Mythos标了公开价格：$25（输入）/$125（输出）每百万tokens，是Opus的五倍。贵不是关键，重点是它没准备卖给所有人。明码标价，却不开放购买，可以说是“有价无市”。

在前沿大模型市场里，决定商业结构的首先是准入权：谁能用、在什么边界下用、凭什么可以用？这些比标价牌更重要。

这套逻辑在普通软件市场里是不存在的，但在大模型市场，我们可以明白一件事：大模型的能力终究会向下扩散，但在能力顶端的那一层，模型公司把控关键是“访问、控制和使用资格”。

这种供给方式更像军工和高端芯片的早期阶段：产品存在，需求强烈，但供给要经过审查、分级、伙伴筛选和使用边界设定。通俗理解，就是东西是有的，想买的人也很多，但卖给谁、怎么卖、卖多少，都得先过一道审查。谁能进这条供给链，谁被挡在门外，决定的不只是谁先做成生意。它正在划出一条新的分界线：在AI经济里，到底谁有资格用上最强的模型。

本篇将重点解读：在“Token经济”主导的叙事之外，AI市场还有一层被忽视的逻辑：前沿层的“准入经济”。

前沿模型不再是“想买就能买”

为什么前沿模型会出现“有资格才能用”这种供给方式？答案要回到市场本身：前沿模型至今都不是一个普通的“能买就买”的市场。

OpenAI在2026年1月的公开文章里说得很直接：算力是AI领域最稀缺的资源。它同时披露，OpenAI的可用算力规模从2023年的0.2GW，增长到2025年约1.9GW；同期，年化经常性收入也从20亿美元增长到200亿美元以上。

Anthropic在4月又宣布，与Google和Broadcom签下了数个GW级别的新一代算力协议（相关容量自 2027 年起陆续上线）；NVIDIA财年2026的收入达到2159亿美元，毛利率超过七成。在最前沿的那层，供给依然被算力、资本与安全边界强烈约束。

这意味着，前沿层的市场结构与中低端工作负载完全不同。单价和吞吐量只是其中一个维度，更关键的是准入本身。

一旦能力接近高风险阈值，厂商卖出的就不再只是“推理资源”，而是一段被访问控制包裹起来的能力。当然，云平台和应用层也有自己的控制力，但那是采购界面上的权力，不是能力边界上的权力。两者的博弈逻辑完全不同。

大模型公司的“双轨策略”

我和做AI应用的朋友也讨论了下Mythos的模式，他的评价是：如果最强的模型（比如 Mythos）连用都不让用，那在这个基础上做的应用可能永远比不过模型公司自己做的产品。“早晚模型公司会吃掉整个市场，模型吞噬一切”，我朋友说。

这个判断听起来很有道理，但他把 “前沿市场”和“工作层市场”混为一谈了。其实Anthropic同时在跑两套完全不同的逻辑——前者卖的是最强模型的入场券，后者卖的是日常干活的算力。

Anthropic把Mythos放进invitation-only框架后，又以$5（输入）/$25（输出）的老价格推出了Opus 4.7，Sonnet 4.6维持$3（输入）/$15（输出）。Sonnet到Mythos，8倍价差。但更关键的是，价格并不是唯一门槛：Mythos不是付得起就能用，而是先要被允许使用。价格没有沿着能力连续上涨，而是在两个层级上分裂了。

这其实是大模型公司的一种“双轨策略”：工作层的开放是维持生态的基本盘，前沿层的配给是留给内圈的战略资源。

前沿层可能越来越像配给市场，工作层却越来越像通缩市场。前者卖的是能力边界与使用资格，后者卖的是够用、够稳、够便宜的执行能力。

除了Anthropic，其他几家头部公司的工作层产品，思路也是一致的。

Google在3月上线的Gemini 3.1 Flash-Lite，其官方定位就是成本最低、专门跑大批量任务的干活模型。OpenAI的CFO也明确表示，未来许多场景里的有用智能会进入每百万token只需几美分的量级。

对于大规模企业工作负载来说，价格竞争、路由竞争、治理竞争和上下文竞争并不会因为Mythos的存在而消失。而中国市场用一轮更剧烈的价格周期验证了这种分化：2024年，多家头部厂商集体加入价格战，轻量模型价格一路下压，甚至有的厂商毛利率跌为负数。

但当价格战打到一定程度，市场自己开始出清了：到2025年下半年，多家头部厂商旗舰大模型开始纷纷上调定价。轻量免费、旗舰提价，是同一个分层逻辑在中国市场的投影。

两套生意，各自卖的是什么

我们继续拆开来看：前沿层和工作层，这两层各自在卖什么？

前沿层卖的是一整套绑定了安全义务的能力授权。

Glasswing的合作条款没有公开全貌，但已知的碎片拼出了一个轮廓：受邀方拿到的不只是Mythos的推理接口，还有与Anthropic安全团队的直接对接、在网络安全防御场景下的优先部署权、以及前文提到的高额使用额度。

这更像一份附带使用边界和安全审查的能力授权协议，供给方在卖出能力的同时，保留了对使用方式的控制权。

英国政府的AI安全机构（AISI）在4月对Mythos的公开评估印证了这一点：它认为Mythos的网络攻击能力远超此前测试过的所有模型。一个模型强到需要国家级安全评估来决定谁可以用，Glasswing才把它包进网络安全防御框架、受限伙伴准入和开源安全资助里，先有这层壳，才有能力的释放。能力越强，壳越厚。

但这层壳由谁来经营？独立公司、云平台、还是模型厂商自己，这仍然是开放的问题。

再来看工作层，卖的则是“运行时”。

比如在Anthropic的官方价格页上，Claude Managed Agents不只按token收费，还按agent持续工作的时长收费；同一份文档还给出了一小时编程任务的成本分解。Claude Code的官方成本说明则更直接，在企业实际部署中，平均成本大约是每个开发者每天13美元，每月150到250美元。这里被出售的已经是一段可以持续协作的数字运行时，远超“一个模型响应”。

OpenAI的路径也非常接近。它的API定价同时覆盖模型、搜索、文件检索、容器、地域处理等多个维度；ChatGPT Business又把普通坐席和开发者坐席分开卖，开发者坐席甚至可以不收固定月费，按实际调用量结算。哪怕是最强的平台方，也在把前沿能力重新包装为不同层级的执行商品。

模型公司的利润来源正在分化：前沿层靠的是稀缺能力本身的溢价，工作层靠的是把坐席、工具、上下文和服务保障重新打包之后的组织能力。对模型公司来说，难题在于能否同时经营两种完全不同的市场逻辑。

这套结构能撑多久

“前沿层配给、工作层通缩”，各赚各的钱。看起来这是一个稳定的结构，但效果如何、它真的稳吗？

有几个方向可能动摇这个判断。

第一，算力扩张的速度。前面提到的数字已经说明供给在快速扩张。如果算力扩张的速度持续快于能力跳跃的速度，前沿层的配给属性就可能被稀释。配给市场的存在是有条件的：它依赖于能力跳跃和供给约束的叠加，一旦供给约束松动，前沿层也可能迅速滑向通缩。

也就是说，Anthropic这类模型公司，之所以能在前沿层做限量供应，靠的是两件事同时成立：一是算力本身就不够用，二是模型能力还在不断往上走。两件事叠在一起，才撑得住这套卡门槛的玩法。但一旦算力供给松了，这个门槛就站不住，优势没了，价格也会跟着下跌。

第二，工作层的价格会不会无限往下跌。中国市场已经走过了一轮完整的周期，轻量模型打到负毛利之后，出现了产能出清和旗舰涨价。这说明通缩不是单向的，工作层的长期状态更可能是周期性波动，而不是无限通缩。

第三，两层之间的边界是否稳定。今天的前沿模型，十八个月后可能就是工作层的标配。Mythos现在是invitation-only，但Anthropic之前的每一代旗舰最终都进入了普通API。这种分化趋势是真实存在的，不过它描述的是一个“快照现象”，不是一个永久的市场结构。更准确的说法是：前沿层的权力集中是脉冲式的，每次能力跳跃会重新集中，间歇期会迅速通缩。

这种“脉冲式”不意味着权力会消失，等Mythos终于开放给所有人用的时候，更强的下一代模型多半已经在内部小圈子里跑起来了。差距不会因为时间过去就消失，每一代新模型出来，差距都会被重新拉开一次。

企业看到的是另一张价格表

前面我们讨论的是“分层会不会消失”，结论是不会。前沿层始终被最新一代模型占据，差距永远会被新一轮跳跃重新拉开。并且，最强模型会越来越稀缺，但旧一代能力会越来越便宜、越来越普及。

也就是说，AI产业不是铁板一块。最顶尖的模型会因为算力、成本和安全门槛，阶段性变成少数玩家和核心客户才能先用的资源；但另一边，上一代能力会继续下沉到企业日常场景里，变成客服、办公、编程、营销等环节中越来越便宜、越来越标准化的工具。

把这两层分开看，2026年AI经济里的很多现象就不难理解了：一边是少数人先拿到的最强模型，另一边是企业日常大量采购的普通AI工具。真正值得追问的，也不只是模型跑分谁第一、哪家公司赚得更多，而是谁能决定最强模型先给谁用、不给谁用。

某种程度上，这张“准入名单”，比benchmark排行榜更能说明AI经济里的权力分配。如果仍然是invitation-only、受限伙伴先行，说明配给属性在能力边界上仍然成立；如果直接self-serve开放，说明供给约束已经松动到足以改变前沿层的市场结构。

不论结果如何，工作层的采购逻辑都不会因此停下来。但这两层的分化，在企业端会以一种很不同的方式呈现。

我后来对比了一些企业真实拿到的报价，发现它和模型公司官网上的Token价格并不是一回事。官网价格更像“标价”或“出厂价”，告诉你某个模型调用一次大概要多少钱；但企业真正采购时，往往不是直接向模型公司买，而是通过云平台、集成商、企业账号、私有化部署、额度包、服务合同等方式接入，这是一套被云平台重新组织过的采购规则。

这意味着，企业实际付的钱，不只包含模型本身的能力成本，还包含云平台的资源、调用通道、数据合规、运维服务、技术支持和采购流程。模型公司决定“模型能力多少钱”，但企业预算最后从哪个云平台入口流走，这本身就是一门生意。

因此，很多讨论只看官网Token单价，很容易忽略的一点是：模型公司公布的是“能力价格”，企业真正面对的是“交付价格”。

到了这个层面，AI经济的竞争就不只是“谁的模型更强”，也不只是“谁的token更便宜”，而是谁能成为企业调用AI的默认入口。

总之，要读懂2026年的AI经济，我们关注token价格表只是表层。更值得盯的，是下一个前沿模型发布时的准入方式：是invitation-only继续？还是直接向所有人开放？前沿模型到底是在走向人人可用的基础设施，还是仍然是一种由少数公司决定谁能使用、如何使用、用到什么程度的稀缺能力。

本文来自转载腾讯科技，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。