一、引子:大厂密集进场,纯聚合赛道变天了
今天网易有道正式发布企业级大模型聚合平台ThinkFlow。

就在4天前的5月8日,中国移动刚刚发布了号称国内最大的大模型聚合平台MOMA。
一周之内,两大巨头先后杀入同一个赛道,而且走的是同一条路线——自己不做大模型,纯做中立的聚合和调度。
这个信号的意义,远比很多人想象的要大。
在此之前,纯聚合赛道的玩家主要是OpenRouter这样的国际平台,以及硅基流动这样的技术型创业公司。而现在,网易和中国移动这两个不同维度的重量级选手同时进场,标志着大模型聚合赛道正式从”边缘生意”升级为”战略必争之地”。
更有意思的是,如果把视野拉宽一点,你会发现整个大模型聚合赛道其实已经形成了非常清晰的”四派混战”格局:
- 纯聚合派:不做模型,只做调度,拼的是工程化能力
- 生态派:打着聚合的旗号,卖的是自己的云服务
- 大模型厂商派:自己做模型,聚合只是附赠的API服务
- 海外中转派:靠翻墙通道吃饭,游走在合规边缘
每一派的逻辑、玩法、风险、天花板都完全不同。今天我们就来把这个赛道的水彻底搅清楚。
二、纯聚合派:网易、移动对标OpenRouter,正规军集体进场
这是最近最热闹的一派,也是最值得关注的一派。
老巨头:OpenRouter、硅基流动
OpenRouter是这个赛道的国际标杆,估值已经十几亿美元,服务超过500万开发者,接入了400多个模型。它的成功证明了一件事:纯聚合是成立的,不是什么”二道贩子”的生意。
硅基流动是国内的技术代表,主打推理加速——同样的模型,它能让你跑得更快更便宜。DeepSeek-R1推理速度比标准部署快10倍以上,LLM场景成本省46%。这是硬实力,拼的就是真功夫。
新成员:网易ThinkFlow、中国移动MOMA
这两家的进场,直接把这个赛道的竞争level拉高了一个档次。
网易ThinkFlow走的是纯企业级路线:
- 一次接入,调用20多款主流大模型
- 智能路由、负载均衡、毫秒级故障切换,99.9%可用率
- 全链路Token消费可视化,每一笔开销都能追溯
- 统一密钥管理,支持私有化部署
- 最关键的是:已经在网易内部亿级流量场景跑过验证

中国移动MOMA走的是基础设施路线:
- 接入300+模型,国内最全,没有之一
- Token成本直降30%,资源占用降50%
- 日均调用量已经千亿级
- 个人套餐最低5.99元,月包24.99元含1000万Token
这两家的共同点非常鲜明:
✅ 完全中立,不担心”把流量导去自家模型”
✅ 合规第一,只接入国产模型,绝对不碰海外API
✅ 强调工程化能力——稳定性、成本管控、故障切换
✅ 都有真实的大规模业务场景验证
✅ 完全中立,不担心”把流量导去自家模型”
✅ 合规第一,只接入国产模型,绝对不碰海外API
✅ 强调工程化能力——稳定性、成本管控、故障切换
✅ 都有真实的大规模业务场景验证
它们的出现,标志着纯聚合赛道正式从”创业公司的游戏”变成了”大厂的战场”。OpenRouter证明了这个模式成立,而网易和移动证明了——这个模式,大厂也能做,而且能做得更好。
三、生态派:聚合只是幌子,卖云服务才是真实目的
代表玩家:阿里云百炼、腾讯云Token Plan、火山引擎。
这一派的玩家有一个共同特点:都有自己的大模型,聚合只是生态的延伸,从来不是核心业务。
阿里云百炼
- 主推通义千问全家桶,顺便接入第三方模型
- 标准坐席198元/月,高级698元,尊享1398元
- 跟阿里云账号打通,发票、权限、审计一条龙
- 支持VPC内网调用,数据不出去
腾讯云Token Plan
- Lite版39元3500万Token,Pro版299元3.2亿
- 兼容OpenClaw、Claude Code、Cursor等热门工具
- 企业版支持子账号管理、用量配额分配
火山引擎
- Coding Plan入门仅19元/月(5000万Token)
- 接入豆包Seedream、DeepSeek全系模型
- 字节生态内的应用天然有优势
这一派的核心优势非常明显:
“顺带着卖”——企业已经在我这买云服务器了,顺便买个Token套餐太自然了。合规、安全、稳定性是天生的,上市公司的背书足够强。
“顺带着卖”——企业已经在我这买云服务器了,顺便买个Token套餐太自然了。合规、安全、稳定性是天生的,上市公司的背书足够强。
但它们有一个天然的、无解的局限:永远不可能完全中立。
企业客户总会担心”你会不会优先推荐自家模型”,”我的数据会不会被用来训练你的模型”。这个信任问题是天生的,从根上就解决不了。
所以生态派的基本盘永远是”已经在用我家云的客户”,很难吃到别人的蛋糕。
四、大模型厂商派:到底是接入聚合平台,还是自己做聚合?这是个战略问题
代表玩家:智谱AI、月之暗面(Kimi)、阶跃星辰、MiniMax、小米等。
这一派最有意思,也最纠结。
它们的核心业务是做大模型,API只是卖模型能力的一个渠道。严格来说,它们根本不是”聚合平台”——因为你只能调用它们自己的模型。
但现在它们面临一个非常现实的战略选择:
到底是把自己的API接入所有聚合平台,还是自己也做一个聚合平台?
这个选择非常难,两边都有坑:
如果接入聚合平台:
✅ 好处:流量更大,触达更多客户,不用自己做销售和渠道
❌ 坏处:失去用户触点,被管道化,利润被聚合平台抽成,最终沦为”模型供应商”
✅ 好处:流量更大,触达更多客户,不用自己做销售和渠道
❌ 坏处:失去用户触点,被管道化,利润被聚合平台抽成,最终沦为”模型供应商”
如果自己做聚合平台:
✅ 好处:掌握用户,掌握数据,利润空间更大
❌ 坏处:没人信你——你自己有模型,怎么可能中立?最后变成”打着聚合的旗号卖自己的模型”,没人买单
✅ 好处:掌握用户,掌握数据,利润空间更大
❌ 坏处:没人信你——你自己有模型,怎么可能中立?最后变成”打着聚合的旗号卖自己的模型”,没人买单
现在的实际情况是:大部分大模型厂商都选择”两条腿走路”——既接入各大聚合平台,同时也维持自己的API官网。
但这里有一个非常残酷的趋势:模型能力越来越趋同,调用价格越来越低。当大家的模型都差不多的时候,企业客户为什么要一个个对接?直接用聚合平台不香吗?
这就导致了一个尴尬的局面:越到后期,大模型厂商就越依赖聚合平台的流量,议价权就越弱。最终可能变成”聚合平台吃肉,大模型厂商喝汤”。
这是所有做大模型的公司都必须面对的战略困局。
五、海外中转派:游走在灰色地带的暴利生意
代表玩家:孙宇晨B.AI、傅盛EasyRouter,以及无数个小中转平台。
这是最喧嚣也最有争议的一派,也是唯一一个”大厂永远做不了”的赛道。
它们最核心的差异化能力,也是官方平台永远做不到的一点:能突破地域限制调用GPT、Claude、Gemini等海外模型。
这是它们初期快速获客的杀手锏:
- 国内开发者没有海外信用卡、没有海外手机号,根本注册不了OpenAI和Anthropic
- 即使有办法注册,网络延迟也高到没法用
- 这类平台相当于提供了一个”一站式翻墙通道”,国内网络直连,人民币结算
这也是为什么孙宇晨的B.AI能在短短一周内用户量破百万——不是因为它便宜,而是因为它能让你在国内直接用GPT和Claude ,这是中国移动、阿里云想都不敢想的事。
但硬币的另一面是,这个核心优势恰恰也是最大的风险:
- 合规红线:这种跨境数据传输本质上是绕开监管,随时可能被一刀切
- 数据安全:你的请求先到中转平台,中转平台再去调海外API,中间多了一跳,数据泄露风险陡增
- 不可持续性:OpenAI一旦收紧API政策,或者发现批量调用行为,说封就封,整个平台直接瘫痪
所以你看孙宇晨的B.AI,个人开发者用户量冲得很快,但国内企业客户基本没有——谁敢把核心业务数据放在一个随时可能被封的平台上?
六、本质区别:四派到底在赚什么钱?
这四种玩家,看起来都是”卖大模型API”,但本质完全不同:
| 派系 | 代表 | 核心特征 | 海外模型支持 | 本质 | 利润率 |
|---|---|---|---|---|---|
| 纯聚合派 | OpenRouter、网易ThinkFlow、移动MOMA、硅基流动 | 自己不做模型,纯中立调度 | ❌ 不支持(合规第一) | AI时代的基础设施/中间件 | 30-55%,靠规模和技术溢价 |
| 生态派 | 阿里云、腾讯云、火山引擎 | 自有模型为主,聚合是附赠 | ❌ 不支持(上市公司合规) | 云服务的增值组件,生态延伸 | 40-50%,生态溢价最高 |
| 大模型厂商派 | 智谱、Kimi、阶跃星辰 | 卖自己的模型能力 | ❌ 不支持(只卖自家模型) | 模型能力供应商,可能被管道化 | 20-60%,差异极大 |
| 海外中转派 | 孙宇晨、傅盛 | 翻墙通道+价格补贴 | ✅ 支持(GPT、Claude等) | 跨境通道+信息差的套利工具 | 暴利但极不稳定,灰色空间大 |
最核心的区别是:你赚的是什么钱?以及,你敢不敢赚海外模型的钱?
- 纯聚合派赚的是”工程化的钱”——帮你解决稳定性、成本管控、安全合规这些头疼问题。为了企业客户的信任,绝对不碰海外模型。
- 生态派赚的是”生态锁定的钱”——你已经用了我的云,顺便用我的模型服务。同样不敢碰海外模型,上市公司的合规风险担不起。
- 大模型厂商派赚的是”模型能力的钱”——我的模型比别人好,你就得用我的。为了自己的核心利益,也不会接海外模型。
- 海外中转派赚的是”跨境通道的钱”——这才是真正的暴利来源。低价只是引流手段,能让国内用户用上GPT-4和Claude,才是用户愿意付钱的核心原因。
这四层护城河的深浅一目了然,但更有意思的是:海外中转平台的核心竞争力恰恰是它们的”不合规性”——正是因为官方平台不能做,才有了它们的生存空间。
这是一个非常扭曲但又真实的市场格局:越合规的平台,模型覆盖越有限;模型覆盖最全的平台,合规风险最大。
七、赛道终局判断:蛋糕到底怎么分?
先给几组数据:
- 2025年中国企业级MaaS市场大模型调用量同比增长16倍,达1941万亿Token
- 2026年3月底,国内AI应用日均调用量突破140万亿,比2024年底增长超千倍
- IDC预测2026年中国MaaS市场规模约186亿元
这个赛道肯定是有前途的,但问题是,谁能抢到最大市场份额?
我给几个判断:
判断一:纯聚合派会吃到最大、最甜的那块蛋糕。
网易和移动的进场只是开始,后面肯定还会有更多大厂跟进。
因为纯聚合是真正的”中立基础设施”——它不属于任何一家大模型厂商,也不绑定任何一朵云,企业用起来最放心。
OpenRouter的估值已经证明了这个模式的天花板,而国内市场比美国更大,需求更旺盛,未来一定会出现百亿级别的纯聚合平台。
判断二:生态派会守住自己的基本盘,但很难突破。
阿里云、腾讯云、火山引擎会牢牢抓住已经在用它们云服务的客户,但很难吃到其他云的客户。
因为中立性这个问题是天生的,无解。客户永远会怀疑”你会不会优先推荐自家模型”。
所以生态派的天花板就是”自己云生态的大小”,很难突破。
判断三:大模型厂商派会加速分化,头部几家吃肉,剩下的喝汤甚至被淘汰。
模型能力趋同是大趋势。当大家的模型都差不多的时候,客户为什么要一个个对接?直接用聚合平台不香吗?
最后只有真正有技术壁垒的头部几家大模型厂商能守住自己的定价权,剩下的都会沦为”聚合平台的模型供应商”,利润被压缩到极致。
判断四:海外中转派会大量死掉,但永远不会完全消失。
这个赛道永远存在一个”灰色地带”——只要GPT-4、Claude这些海外模型还比国产模型强一截,只要国内用户还用不了官方API,海外中转平台就有生存空间。
监管一来,90%的小中转会死掉,但头部的几家大概率会”战略性收缩”——明面上去掉海外模型,暗地里通过各种方式继续提供服务。或者干脆转战海外市场,专门服务有类似需求的其他国家用户。
而且这里有一个非常讽刺的悖论:国产模型越拉胯,海外中转平台的日子就越好过。 什么时候DeepSeek、Qwen真的能追上GPT-4了,什么时候海外中转的核心卖点就没了。
判断五:最终竞争的是”工程化能力”,不是模型数量。
接入300个模型有什么用?企业真正用的也就那五六个。
真正的竞争点是:
- 能不能做到毫秒级故障切换?
- 能不能把成本精确到每一次调用?
- 能不能支持复杂的权限管理和审计?
- 能不能扛住亿级并发?
这些都是脏活累活,但恰恰是这些东西,构成了真正的壁垒。
八、结语:大模型的下半场,拼的是落地能力
很多人把大模型聚合平台看成是”二道贩子”,觉得没技术含量。
这是典型的外行看法。
云计算发展到今天,IaaS层的技术壁垒早就不是”能不能造出虚拟机”了,而是”能不能稳定调度几百万台服务器、出故障能不能快速恢复、账单能不能精确到秒”。
大模型也是一样。当模型能力趋同,真正的竞争就转向了调度、治理、成本、安全这些”基础设施”层面。
网易ThinkFlow的发布,中国移动MoMA的进场,阿里云腾讯云的加码——这些信号都在说同一件事:
大模型的”参数竞赛”结束了,”工程化竞赛”才刚刚开始。
上半场赢的是搞模型的人,下半场赢的,一定是能让模型真正用起来的人。
最大的那块蛋糕,一定不属于投机者,而属于真正愿意干脏活累活、把工程做到极致的人。
本文系【发现AI】原创内容,部分内容综合自网络,如有侵权,请联系编辑删除。
转载请注明来源:https://www.faxai.cn 发现AI

微信扫一扫

