
图片由AI生成
文丨上海期智研究院研究员 李彪
编辑丨李海伦
Anthropic在四月初发布Mythos,距离现在已经近一个月。行业内对于它的讨论,更多的关注点在于“它有多强”,但我更想聊聊它的“发布方式”。
到2026年,Token已经不只是一个“多少钱一百万”的计价单位。越往前沿模型走,真正重要的可能不是价格表,而是谁能先用、谁被邀请、谁被限制、谁只能等待开放。
Mythos的发布方式,为我们提供了一个观察AI经济结构的切口:当模型能力进入最前沿区间,价格不再只是价格,“准入”本身也成了价格体系的一部分。
据官方介绍,Mythos并没有像普通模型那样面向市场公开发售,而是被放进了 Anthropic的 “Project Glasswing(玻璃翼计划)” 框架。它的特殊之处在于,进入框架的参与者,仍然可以通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry调用模型;而真正被限制的,是谁能获得这个入口。
Project Glasswing的首批阵容包括12家launch partners,并向40余家构建或维护关键软件基础设施的组织开放 Mythos Preview 访问权限。
这背后是一套正在重写AI市场规则的逻辑——在前沿这一层,价格已经不是唯一门槛。这里的顺序变成了:先被允许进入,再谈调用成本。
Anthropic给Mythos标了公开价格:$25(输入)/$125(输出)每百万tokens,是Opus的五倍。贵不是关键,重点是它没准备卖给所有人。明码标价,却不开放购买,可以说是“有价无市”。
在前沿大模型市场里,决定商业结构的首先是准入权:谁能用、在什么边界下用、凭什么可以用?这些比标价牌更重要。
这套逻辑在普通软件市场里是不存在的,但在大模型市场,我们可以明白一件事:大模型的能力终究会向下扩散,但在能力顶端的那一层,模型公司把控关键是“访问、控制和使用资格”。
这种供给方式更像军工和高端芯片的早期阶段:产品存在,需求强烈,但供给要经过审查、分级、伙伴筛选和使用边界设定。通俗理解,就是东西是有的,想买的人也很多,但卖给谁、怎么卖、卖多少,都得先过一道审查。谁能进这条供给链,谁被挡在门外,决定的不只是谁先做成生意。它正在划出一条新的分界线:在AI经济里,到底谁有资格用上最强的模型。
本篇将重点解读:在“Token经济”主导的叙事之外,AI市场还有一层被忽视的逻辑:前沿层的“准入经济”。
01
前沿模型不再是“想买就能买”
为什么前沿模型会出现“有资格才能用”这种供给方式?答案要回到市场本身:前沿模型至今都不是一个普通的“能买就买”的市场。
OpenAI在2026年1月的公开文章里说得很直接:算力是AI领域最稀缺的资源。它同时披露,OpenAI的可用算力规模从2023年的0.2GW,增长到2025年约1.9GW;同期,年化经常性收入也从20亿美元增长到200亿美元以上。
Anthropic在4月又宣布,与Google和Broadcom签下了数个GW级别的新一代算力协议(相关容量自 2027 年起陆续上线);NVIDIA财年2026的收入达到2159亿美元,毛利率超过七成。在最前沿的那层,供给依然被算力、资本与安全边界强烈约束。
这意味着,前沿层的市场结构与中低端工作负载完全不同。单价和吞吐量只是其中一个维度,更关键的是准入本身。
一旦能力接近高风险阈值,厂商卖出的就不再只是“推理资源”,而是一段被访问控制包裹起来的能力。当然,云平台和应用层也有自己的控制力,但那是采购界面上的权力,不是能力边界上的权力。两者的博弈逻辑完全不同。
02
大模型公司的“双轨策略”
我和做AI应用的朋友也讨论了下Mythos的模式,他的评价是:如果最强的模型(比如 Mythos)连用都不让用,那在这个基础上做的应用可能永远比不过模型公司自己做的产品。“早晚模型公司会吃掉整个市场,模型吞噬一切”,我朋友说。
这个判断听起来很有道理,但他把 “前沿市场”和“工作层市场”混为一谈了。其实Anthropic同时在跑两套完全不同的逻辑——前者卖的是最强模型的入场券,后者卖的是日常干活的算力。
Anthropic把Mythos放进invitation-only框架后,又以$5(输入)/$25(输出)的老价格推出了Opus 4.7,Sonnet 4.6维持$3(输入)/$15(输出)。Sonnet到Mythos,8倍价差。但更关键的是,价格并不是唯一门槛:Mythos不是付得起就能用,而是先要被允许使用。价格没有沿着能力连续上涨,而是在两个层级上分裂了。
这其实是大模型公司的一种“双轨策略”:工作层的开放是维持生态的基本盘,前沿层的配给是留给内圈的战略资源。
前沿层可能越来越像配给市场,工作层却越来越像通缩市场。前者卖的是能力边界与使用资格,后者卖的是够用、够稳、够便宜的执行能力。
除了Anthropic,其他几家头部公司的工作层产品,思路也是一致的。
Google在3月上线的Gemini 3.1 Flash-Lite,其官方定位就是成本最低、专门跑大批量任务的干活模型。OpenAI的CFO也明确表示,未来许多场景里的有用智能会进入每百万token只需几美分的量级。
对于大规模企业工作负载来说,价格竞争、路由竞争、治理竞争和上下文竞争并不会因为Mythos的存在而消失。而中国市场用一轮更剧烈的价格周期验证了这种分化:2024年,多家头部厂商集体加入价格战,轻量模型价格一路下压,甚至有的厂商毛利率跌为负数。
但当价格战打到一定程度,市场自己开始出清了:到2025年下半年,多家头部厂商旗舰大模型开始纷纷上调定价。轻量免费、旗舰提价,是同一个分层逻辑在中国市场的投影。
03
两套生意,各自卖的是什么
我们继续拆开来看:前沿层和工作层,这两层各自在卖什么?
前沿层卖的是一整套绑定了安全义务的能力授权。
Glasswing的合作条款没有公开全貌,但已知的碎片拼出了一个轮廓:受邀方拿到的不只是Mythos的推理接口,还有与Anthropic安全团队的直接对接、在网络安全防御场景下的优先部署权、以及前文提到的高额使用额度。
这更像一份附带使用边界和安全审查的能力授权协议,供给方在卖出能力的同时,保留了对使用方式的控制权。
英国政府的AI安全机构(AISI)在4月对Mythos的公开评估印证了这一点:它认为Mythos的网络攻击能力远超此前测试过的所有模型。一个模型强到需要国家级安全评估来决定谁可以用,Glasswing才把它包进网络安全防御框架、受限伙伴准入和开源安全资助里,先有这层壳,才有能力的释放。能力越强,壳越厚。
但这层壳由谁来经营?独立公司、云平台、还是模型厂商自己,这仍然是开放的问题。
再来看工作层,卖的则是“运行时”。
比如在Anthropic的官方价格页上,Claude Managed Agents不只按token收费,还按agent持续工作的时长收费;同一份文档还给出了一小时编程任务的成本分解。Claude Code的官方成本说明则更直接,在企业实际部署中,平均成本大约是每个开发者每天13美元,每月150到250美元。这里被出售的已经是一段可以持续协作的数字运行时,远超“一个模型响应”。
OpenAI的路径也非常接近。它的API定价同时覆盖模型、搜索、文件检索、容器、地域处理等多个维度;ChatGPT Business又把普通坐席和开发者坐席分开卖,开发者坐席甚至可以不收固定月费,按实际调用量结算。哪怕是最强的平台方,也在把前沿能力重新包装为不同层级的执行商品。
模型公司的利润来源正在分化:前沿层靠的是稀缺能力本身的溢价,工作层靠的是把坐席、工具、上下文和服务保障重新打包之后的组织能力。对模型公司来说,难题在于能否同时经营两种完全不同的市场逻辑。
04
这套结构能撑多久
“前沿层配给、工作层通缩”,各赚各的钱。看起来这是一个稳定的结构,但效果如何、它真的稳吗?
有几个方向可能动摇这个判断。
第一,算力扩张的速度。前面提到的数字已经说明供给在快速扩张。如果算力扩张的速度持续快于能力跳跃的速度,前沿层的配给属性就可能被稀释。配给市场的存在是有条件的:它依赖于能力跳跃和供给约束的叠加,一旦供给约束松动,前沿层也可能迅速滑向通缩。
也就是说,Anthropic这类模型公司,之所以能在前沿层做限量供应,靠的是两件事同时成立:一是算力本身就不够用,二是模型能力还在不断往上走。两件事叠在一起,才撑得住这套卡门槛的玩法。但一旦算力供给松了,这个门槛就站不住,优势没了,价格也会跟着下跌。
第二,工作层的价格会不会无限往下跌。中国市场已经走过了一轮完整的周期,轻量模型打到负毛利之后,出现了产能出清和旗舰涨价。这说明通缩不是单向的,工作层的长期状态更可能是周期性波动,而不是无限通缩。
第三,两层之间的边界是否稳定。今天的前沿模型,十八个月后可能就是工作层的标配。Mythos现在是invitation-only,但Anthropic之前的每一代旗舰最终都进入了普通API。这种分化趋势是真实存在的,不过它描述的是一个“快照现象”,不是一个永久的市场结构。更准确的说法是:前沿层的权力集中是脉冲式的,每次能力跳跃会重新集中,间歇期会迅速通缩。
这种“脉冲式”不意味着权力会消失,等Mythos终于开放给所有人用的时候,更强的下一代模型多半已经在内部小圈子里跑起来了。差距不会因为时间过去就消失,每一代新模型出来,差距都会被重新拉开一次。
05
企业看到的是另一张价格表
前面我们讨论的是“分层会不会消失”,结论是不会。前沿层始终被最新一代模型占据,差距永远会被新一轮跳跃重新拉开。并且,最强模型会越来越稀缺,但旧一代能力会越来越便宜、越来越普及。
也就是说,AI产业不是铁板一块。最顶尖的模型会因为算力、成本和安全门槛,阶段性变成少数玩家和核心客户才能先用的资源;但另一边,上一代能力会继续下沉到企业日常场景里,变成客服、办公、编程、营销等环节中越来越便宜、越来越标准化的工具。
把这两层分开看,2026年AI经济里的很多现象就不难理解了:一边是少数人先拿到的最强模型,另一边是企业日常大量采购的普通AI工具。真正值得追问的,也不只是模型跑分谁第一、哪家公司赚得更多,而是谁能决定最强模型先给谁用、不给谁用。
某种程度上,这张“准入名单”,比benchmark排行榜更能说明AI经济里的权力分配。如果仍然是invitation-only、受限伙伴先行,说明配给属性在能力边界上仍然成立;如果直接self-serve开放,说明供给约束已经松动到足以改变前沿层的市场结构。
不论结果如何,工作层的采购逻辑都不会因此停下来。但这两层的分化,在企业端会以一种很不同的方式呈现。
我后来对比了一些企业真实拿到的报价,发现它和模型公司官网上的Token价格并不是一回事。官网价格更像“标价”或“出厂价”,告诉你某个模型调用一次大概要多少钱;但企业真正采购时,往往不是直接向模型公司买,而是通过云平台、集成商、企业账号、私有化部署、额度包、服务合同等方式接入,这是一套被云平台重新组织过的采购规则。
这意味着,企业实际付的钱,不只包含模型本身的能力成本,还包含云平台的资源、调用通道、数据合规、运维服务、技术支持和采购流程。模型公司决定“模型能力多少钱”,但企业预算最后从哪个云平台入口流走,这本身就是一门生意。
因此,很多讨论只看官网Token单价,很容易忽略的一点是:模型公司公布的是“能力价格”,企业真正面对的是“交付价格”。
到了这个层面,AI经济的竞争就不只是“谁的模型更强”,也不只是“谁的token更便宜”,而是谁能成为企业调用AI的默认入口。
总之,要读懂2026年的AI经济,我们关注token价格表只是表层。更值得盯的,是下一个前沿模型发布时的准入方式:是invitation-only继续?还是直接向所有人开放?前沿模型到底是在走向人人可用的基础设施,还是仍然是一种由少数公司决定谁能使用、如何使用、用到什么程度的稀缺能力。
本文来自转载腾讯科技 ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

微信扫一扫

