小米不想“贱卖”Token

小米不想“贱卖”Token

文|晓静

编辑|徐青阳

近日,小米宣布 MiMo 大模型面向全球开发者推出 Token Plan 订阅套餐,雷军亲自发微博官宣:Max 档 659 元 / 月,面向国际开发者定价 100 美元 / 月,与 Anthropic Claude Max 5x 相同。同一天,雷军发文称 MiMo 大模型前一日调用量突破 1 万亿 Token。

小米不想“贱卖”Token

作为一家从手机做到汽车,制造业基因极强的公司,如今把大模型订阅套餐价格直接锚定全球 AI 第一梯队,这在行业里还是唯一一家,也引起了不少的争议。仔细看,Mimo Token Plan 的订阅制,和大模型行业惯用的订阅制还有一些根本上的不同。

01 罗福莉的发声,不踩 Anthropic 踩过的坑?

MiMo Token Plan 发布三天后,Anthropic 宣布禁止 Claude Pro 和 Max 订阅用户通过 OpenClaw 等第三方 Agent 框架调用。

MiMo 大模型负责人罗福莉随即在 X 平台发布长文,详细分析了这件事。

她首先解释了 Anthropic 的困境。Claude 的订阅制(Pro 20 美元 / 月,Max 100-200 美元 / 月)原本是为个人用户的正常使用强度设计的,但 OpenClaw 等 Agent 框架的调用模式完全不同:在单个用户查询中,框架会以独立 API 请求的形式发出多轮低价值的工具调用,每个请求都包含超过 10 万 Token 的上下文窗口,即使命中缓存,这也是一种浪费,在极端情况下还会拉低其他查询的缓存命中率。

她表示:” 实际每次查询的请求数比 Claude Code 自身的框架高出数倍。换算成 API 定价,实际成本可能是订阅价格的几十倍。这可不是小差距,而是天壤之别。”

换句话说,Claude 订阅制的本质问题是:固定月费无法覆盖 Agent 场景下的实际算力消耗。用户付 200 美元,却用掉了几千美元的计算资源。Anthropic 不得不叫停第三方框架接入,把用户引导至按量付费的 API。

罗福莉由此引出 MiMo Token Plan 的设计逻辑。她说,Token Plan 支持第三方框架接入,但按 Token 配额计费,” 与 Claude 新推出的额外使用套餐的逻辑相同 “。这意味着用户用多少付多少,不会出现订阅制下 ” 薅羊毛式 ” 的成本倒挂。” 我们的目标是长期稳定地交付高质量的模型和服务,而不是让你冲动付费后就弃用。”

她也扮演了一次行业定价的 ” 吹哨人 ” 角色:” 我建议 LLM 公司在弄清楚如何在不造成资金流失的情况下为 Coding 方案定价之前,不要盲目地竞相压低价格。以极低的价格出售 Token,同时对第三方敞开大门,这看起来对用户很有吸引力,但这却是一个陷阱—— Anthropic 刚刚摆脱的那个陷阱。”

这篇帖子浏览量超过 71 万,引发了大量讨论。有开发者认同她对 OpenClaw 上下文管理低效的判断,有人指出 Anthropic 此举本质上是在保护自家 Claude Code 的护城河,也有人对 MiMo Token Plan 本身的 Credit 换算机制提出质疑。

小米不想“贱卖”Token

02 现实的挑战

100 美元的定价有一定的合理性。MiMo-V2-Pro 的 API 价格(输入 1 美元 / 百万 Token,输出 3 美元)约为 Claude 同级模型的五分之一,在性价比上确实有竞争力。两周免费推广期间,MiMo-V2-Pro 在 OpenRouter 上单周 Token 消耗量突破 4 万亿,日榜、周榜、月榜均排名第一,编程领域市占率一度超过 30%。

但挑战来得很快。免费期结束后,MiMo-V2-Pro 在 OpenRouter 上的周调用量从高峰下滑。OpenRouter 上的规律比较直接,在达到一定性能阈值后,谁便宜或免费,谁就有可能冲到榜一。它的排名证明了模型能力和可用性,但是同时,调用量受是否免费的影响巨大。

MiMo Token Plan 四档方案从 39 元 / 月到 659 元 / 月,Max 档国际定价 100 美元 / 月。按 Credit 换算,MiMo-V2-Pro 消耗 1 Token 等于 2 Credits,Max 档 1600M Credits 约等于 800M Token 的 Pro 模型调用量。

这个价格对标的是 Anthropic Claude Max 5x 套餐(100 美元 / 月),后者提供 Pro 版 5 倍的使用额度。MiMo Token Plan 没有行业普遍存在的 5 小时使用限额,支持集中消耗 Token。

开发者社区的争议也不少。有用户在社交网络上拆解了小米 Token Plan 的实际消耗:由于 Credit 倍率机制(Pro 模型 1 Token 消耗 2 Credits,超过 256K 上下文则消耗 4 Credits),加上 Agent 框架大量使用缓存 Token,入门套餐的实际可用量远低于字面数字。

也有开发者反馈 MiMo-V2-Pro 在复杂推理上偶尔出现 ” 无限循环 “,以及内容审核系统误拦截正常 API 调用的问题。

腾讯科技尝试询问小米官方, Credits 到底如何折算为不同模型、不同上下文长度下的真实 token 使用量,是否有完整公开的计算逻辑?但截至发稿,未得到官方的回应。

但是从罗福莉的公开发声来看,对 ” 大模型订阅制 ” 算不清账的问题已经提出了质疑,不 ” 贱卖 Token”,希望用健康的现金流来换取模型能力的稳定迭代、用户的持续使用,是基本态度。

小米不想“贱卖”Token

图:免费期结束后,MiMo-V2-Pro 在 OpenRouter 上的周调用量从高峰下滑。

理想很丰满。但是,从免费到付费的转换率,是所有大模型公司面临的共同难题。从免费到付费切换的过程,也往往会面临最大的争议,MiMo 能否在付费的前提下保持用户黏性,是接下来几周最值得观察的数据点。

03 唯一还在做基座大模型的手机厂商?

在小米高调推自己的大模型的同时,也引出了一个疑问,大模型业务之于小米,到底意味着什么?

回到更早的时间线。2023 年,雷军推动成立大模型 Core 团队。同年 5 月,根据媒体的公开报道,小米曾公开表示 ” 小米不会做 ChatGPT,不搞 AI 的军备竞赛 “。

但小米的态度在悄悄发生转变。

2025 年 4 月,MiMo-7B 开源;11 月,前 DeepSeek 研究员罗福莉加入,出任大模型负责人;12 月发布 MiMo-V2-Flash。2026 年 3 月 19 日凌晨,三款模型同步发布:万亿参数的 MiMo-V2-Pro、全模态的 Omni 和语音合成 TTS。发布前,Pro 的早期版本以 “Hunter Alpha” 代号匿名上线 OpenRouter,七天突破 1 万亿 Token 调用量,一度被社区猜测为 “DeepSeek V4″。不到一年,小米的大模型从 7B 参数走到了万亿参数。

据接近小米的人士透露,小米内部开始认为 ” 大模型是未来科技公司必须要有的能力。小米未来所有产品端的能力,需要有一个主的模型去控制、去培养、去指导。这个主模型必须是自己的。因为只有自己的,才能决定你的用户习惯、你的输入数据能不能交给第三方。”

手机、汽车、IoT 设备产生的海量用户数据是最核心的资产,如果基座模型依赖第三方,数据主权和产品迭代节奏都将受制于人。

从组织架构看,大模型 Core 团队归属小米集团技术委员会,不隶属于手机部或汽车部。据了解,小米副总裁曲恒负责管理这条线,但罗福莉拥有很高的独立性,她加入后按自己的需求重新组建了团队,核心成员平均年龄 25 岁,清北毕业生占比超六成。团队运作有较高的自主性。

从财报及管理层对外发声也可以看出,研发投入规模也在快速攀升。小米 2025 年全年研发开支 331 亿元,同比增长 37.8%,接近全年经调整净利润 392 亿元。据小米总裁卢伟冰在业绩会上的表述,AI 投入约占研发总额的四分之一。

雷军在 MiMo-V2-Pro 发布当天宣布,2026 年小米在 AI 领域的研发和资本投入将超过 160 亿元,未来三年至少 600 亿元。资本开支方面,2025 年前三季度累计约 130 亿元,同比增长 86.7%,卢伟冰明确表示增量主要来自汽车和 AI。算力上,小米采取自建万卡 GPU 集群加金山云合作的混合模式。

从行业横向对比来看,小米的选择是孤独的。华为盘古大模型主要通过鸿蒙系统实现端云协同,vivo 蓝心大模型服务于 OriginOS 的 AI 助手,OPPO 安第斯大模型升级了小布助手,荣耀走 AI 终端生态路线。这些厂商的大模型都是 “AI 服务于手机 “,没有一家独立运营 API 平台或对外售卖模型订阅。包括苹果、三星在内的全球手机巨头,也没有对外直接提供服务的基座大模型。

vivo 副总裁周围的公开表态也许可以代表了多数厂商的态度:未来手机可能进化为 ” 智能体 “,但实现路径不一定需要自研基座模型,接入第三方大模型同样可以。

04 大模型成为又一个主线业务?

从种种公开信息来看,大模型之于小米集团,正在发生一些微妙但关键的变化:

它不只是一个服务于手机和 IoT 的底层能力,开始具备向一条独立业务线演进的结构性条件。最直观的信号,是产品形态的变化。

小米已经推出了面向开发者的 API 平台,并配套提供分层的 Token 订阅方案。无论规模大小,这一步本身,就已经越过了传统 ” 技术中台 ” 的边界。

雷军曾在公开场合明确提出,小米计划在 2026 年实现一次关键性的技术整合:在一款终端产品中,让自研芯片、操作系统与 AI 大模型完成协同落地。

至今为止,能同时覆盖这三层能力的公司并不多。华为通过麒麟芯片、鸿蒙系统与盘古模型,已经形成过相对完整的技术闭环;苹果公司则长期在芯片与操作系统上建立深度一体化,并正在强化其端侧 AI 能力。

小米如果完成这一组合,也许能进入一个截然不同的竞争维度。

但如果把视角拉回财报,情况又显得克制得多。

根据披露,小米将 AI 相关业务与智能电动汽车一同归入 ” 创新业务 ” 板块。2025 年,该板块收入为 1061 亿元,其中汽车贡献了约 1033 亿元,AI 相关收入尚未被单独披露。产品和形态已经在向独立业务靠拢,但公开财务信息上还未完成验证。

当小米将高阶订阅方案定在与 Claude 相近的区间,并开始质疑行业普遍推行的订阅制的时候,目的可能未必在于 ” 价格竞争 “。通过锚定头部模型,主动进入同一层级的市场叙事,证明 ” 上桌的能力 ” 可能更为重要。

本文来自投稿,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
最强Claude比黄金还贵,有人用省token.skill 立降65%,还有10个小妙招
上一篇 4小时前
年轻人的第一个爱马仕,10分钟入门 Hermes Agent
下一篇 3小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注