DeepSeek降价背后：Token生意在重新洗牌

图片由AI生成

作者丨上海交通大学行业研究院“ 人工智能+”行业研究团队负责人、安泰经管学院教授史占中

编辑丨李海伦

4月底，AI圈的热度被两场发布会点燃：OpenAI亮出GPT-5.5，DeepSeek紧接着推出V4。AI圈再次进入了一轮“谁更强”的热烈讨论。

如果我们把视角从模型能力切换到商业层面，会发现一个更有意思的现象——两家给同等任务标的Token价格，差了一个数量级。

以API价格为例，GPT-5.5的标准报价为输入每百万Token 5美元、输出每百万Token 30美元；DeepSeek V4-Pro在2.5折促销期内的报价为缓存命中输入每百万Token0.025元、缓存未命中输入每百万Token 3元、输出每百万Token 6元。按1美元约合7.2元人民币粗略折算，GPT-5.5的输出价格约为每百万Token 216元，是DeepSeek V4-Pro促销价的30多倍。

把视野放大到整个产业环境下来看，这场价差就更耐人寻味了——2026年的AI行业，正处在算力成本集体上行、各家厂商纷纷调价的关口。

为什么同一个产业里会同时出现“涨价”和“低价”两种截然相反的信号？为什么GPT-5.5敢翻倍涨？DeepSeek敢直接把价格再次降价？为什么用户既愿意为前者付溢价，又被后者大规模吸引？

按常理，一个成熟产业的价格信号应该是同向的。但AI大模型行业偏偏走出了一条截然相反的路，而且两端都站满了买家。

这些问题指向同一个答案——我们必须重新理解“Token”这件事。

“Token”原本只是技术文档里的字符切分单位，在短短几年内演化为一种新的“经济要素”。它被定价、被消耗、被囤积、被讨论，甚至行业认为它具备某种“准商品”的属性。当一个技术概念跨越工程边界，开始承担起市场、产业乃至社会层面的功能时，关于它的经济学叙事便悄然展开。

本文尝试从货币理论、市场结构、商业模式与公共政策等产业经济学层面，对Token进行一次系统审视。文章将分为上下两篇：上篇《Token经济：一场正在展开的“智能定价革命”》；本篇作为该系列的下篇，重点关注Token交易市场结构和未来发展趋势。

本文将主要围绕三个方向来探讨：今天的Token市场，呈现怎样的形态？Token背后的定价逻辑如何？当我们把目光投向未来，这个市场又会如何演化？

一、今天的“Token市场”长什么样？

巨头的“定价逻辑”各不相同

我们以前沿模型市场中几家具有代表性的厂商为例——OpenAI、Anthropic和Google，它们的定价策略主要围绕“价值定价为主体、成本约束为底线、竞争对标为参照” 的混合策略。但混合归混合，三者的战略侧重点和“定价锚点”显著不同。

OpenAI以竞争对手价格为锚，采取“市场渗透 + 分层定价” 的打法。低价的入门产品（如GPT-4o-mini）甚至可能战略性亏损，目的是抢占市场份额和开发者生态；高价产品则承担盈利的任务。其核心战略意图是建立生态霸权，让全球开发者依赖其API。这是一种以未来换现在的玩法。

Anthropic以自身价值为锚。它不追求最低价，而是强调安全性、可靠性和企业级服务的品质溢价。其定价反映的是“值得信赖的AI伙伴”的品牌定位——你为之付费的不只是Token，更是一种确定性。

Google以生态效益为锚。 Gemini的Token定价常常与Google Cloud打包，单看Token价格可能不是最优，但结合GCP生态的整体价值便构成了独特的竞争力。其核心战略意图是用AI驱动云计算业务的增长。

这里有一个被普遍忽视的现实：Token的“真实成本”可能连公司自身也难以精确核算。训练成本、推理成本、研发人员分摊、数据采购、安全对齐成本……这些项目难以精确归因到单个Token上，使得严格意义的“成本加成定价”在操作层面几乎不可行。换句话说，“成本”在Token经济里更像一条模糊的底线，而不是一把精确的尺子。

放眼长远，三家的策略将趋于收敛。当市场充分竞争后，价格层面的博弈空间被压缩，差异化将从Token价格本身转向服务质量、安全保障和生态价值。而更根本的演进方向，可能是定价单位本身的变革——从“按Token计费”转向“按任务/结果计费”。届时与我们现阶段所讨论的定价策略比较，可能会失去意义。

市场结构呈现“分层式寡头垄断”

如果非要给当前的Token市场画一张结构图，最贴切的描述是——这是一个处于“分层式寡头垄断”状态的市场。

在前沿模型这一高端层级，市场集中度极高：OpenAI、Anthropic、Google等核心玩家构成稳固的寡头结构。而在中低端市场，景象则完全不同，开源模型与众多云服务商提供了差异化的替代方案，呈现出垄断竞争的特征。

两种完全不同的市场状态，在同一个产业里并存。这种独特的结构，也深刻地塑造了厂商的定价行为，并通过三重机制释放影响：

第一重影响是价格引导。比如在高端层级，OpenAI往往率先调价，Anthropic和Google随后跟进，呈现“寡头博弈”：少数玩家彼此观望、彼此试探，价格调整变成一种心照不宣的协同动作。

第二重影响来自开源模型构筑的“价格天花板”。闭源厂商的定价不能远离开源替代品的水平，否则用户便会用脚投票，迁移到自部署或第三方开源托管服务机构。该领域无形的天花板，把所有闭源玩家的定价空间锁定在一个相对克制的区间内。

第三重影响是低锁定成本约束溢价空间。用户切换AI提供商的成本极低，往往只需要修改几行API代码，这迫使即使是寡头也不敢过度定价。当然，厂商并非束手无策，他们正在通过微调模型、专属功能和生态工具链构建“隐性锁定”，试图把用户的迁移成本逐步垒高。

在更宏观的视角下，Token市场同时受到两种相反力量的拉扯：一边是“赢家通吃”，最强模型吸引最多用户，最多用户产生最多数据，最多数据训练出更强模型，这是一个自我强化的飞轮；

另一边是“去中心化”。开源运动和垂直领域差异化不断瓦解和削弱集中化的趋势。这两种力量的角力，将决定市场的最终形态。一个合理的猜测是：市场可能稳定在“2-3家通用寡头 + 开源中低端生态 + 众多垂直领域专精玩家”的三层结构上。

这其中，给我们留下的核心警示是：AI行业的技术变革速度极快，市场结构高度不稳定。一次重大技术突破，比如开源模型达到闭源顶级水平，就可能瞬间颠覆现有格局。任何关于市场结构的分析，都应该保持“有效期不超过两年”的审慎态度。

Token价格的地区差异：一场正在扩大的全球算力分化

目前，Token价格的地区差异已经存在且正在扩大，“AI算力套利”和产业转移的趋势已经开始显现。

2026年2月，OpenRouter平台的数据已经反映出这种趋势：根据该平台的全球AI模型调用量排名——在2月16日至22日的周榜单中，平台调用量排名前五的模型，有四款来自中国厂商，包括MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5、DeepSeek的V3.2。

同样一个复杂编码任务，一个在Claude Opus 4上可能消耗数十美元的复杂编码任务，但在DeepSeek V3.2这类低价模型上可被压到1美元以内。还有MiniMax、月之暗面等中国厂商，已经将输出价格普遍压低至每百万token 2–3美元左右的区间。a16z合伙人Martin Casado估计，使用开源AI栈的初创公司中大约有80%跑在中国模型上。

Token价格的地区差异已经不再是临时的市场现象，而是由能源成本、芯片获取能力、产业政策共同塑造的长期格局。

能源成本是最直接的变量。中国中西部地区电力价格约为美国加州的1/3到1/2，且清洁能源占比持续提升，使得大规模AI训练集群的运营成本显著降低。DeepSeek等厂商正是依托这一优势，将推理成本压缩至美国同行的几十分之一。

并且，芯片获取能力则决定了算力供给的弹性。在美国出口管制背景下，中国厂商无法获得最先进GPU，反而倒逼出算法层面的效率创新——MoE（混合专家）架构、量化压缩、推理优化等技术路线在中国率先规模化应用。这种“受限创新”反而形成了独特的成本优势：用次优硬件跑出接近顶级的性能。

此外，产业政策进一步放大了上述优势。中国将AI定位为战略性新兴产业，在数据中心用地审批、能耗指标分配、税收优惠等方面给予支持；地方政府竞相建设智算中心，以补贴电价、配套基础设施等方式吸引AI企业入驻。这种“政策-产业”正循环，使得中国Token价格在全球市场形成结构性洼地。

与此同时，印度以及马来西亚、印尼、泰国等部分东南亚市场，也因土地、人工、电力和政策成本优势，正在成为AI算力部署的新选择。整体来看，印度和东南亚的算力托管成本也显著低于北美。

在这样的背景下，这种价格差异正在驱动产业的三类变化：

第一，API调用的跨境套利。一些企业通过调用低价地区的API来降低成本。比如用国产模型处理非敏感的基础任务，只在关键任务上使用GPT系列模型。这类似于IT外包，核心任务留在本国，非核心任务外包到低成本地区。

第二，AI创业公司的区位选择。Token成本差异影响AI创业公司的选址。如果一家AI应用公司的主要成本是Token消耗，它可能选择在Token价格更低的地区运营。

第三，数据中心的地理布局优化。企业根据电力成本、气候条件（影响冷却成本）和Token价格选择数据中心位置。

但套利存在三个天然限制：

● 数据合规：跨境数据传输受到各国数据保护法约束（GDPR、中国数据出境安全评估等），限制了随意跨区调用API。

● 延迟和品质：远距离调用存在网络延迟，且不同地区模型的语言和文化适配性不同。

● 地缘政治：中美科技脱钩趋势下，依赖对方的AI基础设施存在“断供”风险。

长期来看，Token价格差异将驱动“AI算力的全球再平衡”，算力密集型产业向低成本地区流动，但受数据主权和地缘政治约束。这类似于制造业的全球化和逆全球化的博弈——效率驱动全球化，安全驱动本地化，两种力量并存。

二、Token定价，将演化为哪些模式？

了解了Token经济的轮廓，我们需要关注其背后的逻辑——同样是API，这个价格到底是怎么定出来的？

为什么同一家厂商的输出Token要比输入Token贵上数倍？为什么按量计费会逐步让位于结果导向定价，甚至催生出Token期货这样的金融衍生品？这些问题的答案，共同构成了AI产业的商业底座。

Token输入与输出：为什么价格不一样？

观察各家厂商的定价表，我们会发现一个普遍现象：对于OpenAI、Anthropic、Google等海外前沿闭源模型，输出Token的价格通常是输入Token的5-8倍。对于国内模型厂商的定价还会进一步压低——部分模型约为3到5倍，DeepSeek等高性价比模型甚至进一步压低到约2倍左右。

这种定价差主要是由成本、价值和策略三层经济学逻辑决定。

成本层面，输出Token的生成需要模型逐个“预测”下一个Token（自回归生成），计算密度远高于输入Token的“理解”过程（并行处理）。输出每个Token的实际GPU计算量是输入的数倍，成本差异是真实存在的。

价值层面，输出Token承载了模型“思考”的成果——回答问题、生成代码、提供建议。输入Token只是用户提供的原始材料（问题、上下文），输出Token才是用户真正为之付费的“价值产出”。这种差异定价反映了“原材料”和“成品”之间的价值差，类似于棉花和衣服的价格差。

策略层面，差异定价还具有行为引导功能。较低的输入价格鼓励用户提供充分的上下文（长提示词），这有助于模型给出更好的输出。如果输入和输出同价，用户会倾向于压缩输入长度，导致输出质量下降。差异定价实际上是通过价格机制引导用户的使用行为，优化整体系统效率。

从经济学的角度看，这是典型的“差别定价”（Price Discrimination），对同一产品链条中的不同环节，按照成本和价值的差异分别定价。它类似于航空公司对“去程”和“回程”、甚至同一航班不同舱位采取的不同定价，基于成本差异、需求弹性差异和行为引导的综合考量。

未来，随着模型架构创新（如非自回归生成），输入输出的成本差异可能缩小，但价值差异定价的逻辑将长期存在。

定价模式走向“三浪叠加”

输入与输出的价差，只是Token定价的“静态切片”。如果把时间维度拉长，会看到一幅更宏大的图景，定价模式本身正在发生结构性迁移。

3-5年后的Token定价模式，将经历“三浪叠加”的演化。

第一浪：按量计费与包月订阅并行（已在发生）。面向开发者的API保持按量计费——灵活、可控；面向消费者的产品走向包月订阅——ChatGPT Plus就是典型。这两种模式针对不同用户群体共存，井水不犯河水。

第二浪：结果导向定价崛起（2-3年内）。随着Agent和自动化工作流成熟，定价单位将从“消耗了多少Token”转向“完成了什么任务”。例如，“帮你写一份合同”定价50元，而不是“消耗了10万Token定价X元”。这种模式对用户更友好（无需理解Token概念），对提供商也更有利（能力越强、效率越高，利润率越高）。

第三浪：金融化和衍生品市场（3-5年内可能出现雏形）。当Token成为关键的企业生产要素，企业需要对冲Token价格波动风险，就像航空公司对冲燃油价格一样。Token期货、算力互换合约等金融工具有明确的市场需求。但完整的Token交易所需要标准化的Token定义和监管框架，这需要更长时间。

三浪叠加的终局是“混合定价体系”：基础层按量计费（类似水电煤气）、应用层按结果/订阅计费（类似SaaS）、金融层有期货和对冲工具（类似大宗商品市场）。Token定价将不再是一个单一模式，而是一个多层级的价格生态系统。

三、未来的Token市场，会变成一门怎样的生意？

定价方式的演化，背后的逻辑发生在“竞争范式”的转变。

比如Anysphere公司开发的Cursor，在短时间内实现了数亿美元级别的收入规模，并迅速进入大量企业开发团队，被视为增长最快的一批AI SaaS产品之一。

Cursor在两年内经历了多轮定价调整：从最初的固定订阅，到请求配额制，再到基于模型使用量的按量计费。与此同时，Cursor的产品形态也在走向Background Agents等更完整的任务执行模式。

从使用层面来看，用户不再只是向模型提问，还有“修复Bug”“重构一段代码”“补齐测试”等这样的开发任务交给系统。对用户来说，重要的是这个任务是否被完成、代码能不能合并、开发时间是否被节省。

从它的付费模式，我们可以看到明显的变化：Token仍是底层成本单位，用户真正愿意付费的对象，正在从“模型调用”转向“任务完成”。

从“卖Token到卖结果”：商业模式的根本转向

从“卖Token”到“卖结果”的转变是大势所趋，但不会完全替代，两种模式将长期共存。

“卖结果”模式的驱动力很明确：用户不关心Token，关心的是问题有没有解决。

当AI能力可靠到一定程度，按任务/结果定价更符合用户的心智模型。比如企业客户更愿意为“一次财务审计”付费500元，而不是估算“这次审计大概需要多少Token”。这种模式已经在一些垂直场景出现，法律AI按“合同审查”计费、设计AI按“logo方案”计费。

但“卖结果”面临两个核心难题：

第一，“结果”的定义和衡量。什么算“任务完成”？如果AI写的代码有bug算不算完成？如果AI的法律意见不够全面算不算完成？结果的质量评估远比Token数量计量复杂。

第二，风险承担的转移。按Token计费时，用户为“过程”付费，风险主要由用户承担：即使模型输出不理想，Token已经被消耗，成本也已经发生。

但按结果计费时，用户为“结果”付费，风险会更多转移到服务提供商一侧：如果任务没有完成、结果不达标，就很难收费，甚至需要退款或补偿。这意味着，提供商必须对模型能力、任务边界和交付质量有更强的控制力，也要有足够信心承担结果不确定性的成本。

最可能的演化路径是“Token作为底层计费协议、结果作为上层商业包装”，这类似于电信行业用户按“通话分钟”（底层）或“套餐”（上层）付费，底层的流量计量一直存在，但用户感知的是套餐价格。

Token不会消失，它将退居幕后成为AI产业链的底层计量标准，而用户看到的将是“任务完成”“订阅套餐”“服务包”等上层定价形态。

Token交易所：商品化的极限想象

当Token开始像商品一样被大规模买卖，一个自然而然的问题就冒出来了。

2025年，GPU云计算公司CoreWeave在纳斯达克上市，随后四个月股价最高冲至187美元，市值一度逼近900亿美元。这家公司最初从事加密货币挖矿，后来转型为面向AI工作负载的GPU云服务，其中核心商业模式之一，简单概括就是买进英伟达GPU，再租出算力。

稀奇的是资本市场给出的反应——投资人开始像对待石油管道公司一样，给算力基础设施公司定价：不看增长故事，只看长期合同和可预测的现金流。

CoreWeave高度依赖多年期的“take-or-pay”合同，客户承诺购买固定的GPU容量，无论是否实际使用都必须付款。“Take-or-pay”（照付不议）是石油天然气管道行业的标准合同结构。

如果算力是大宗商品，Token就是从这个商品里提炼出来的标准化单位。那么未来会不会出现一个统一的“Token交易所”，让算力像原油一样在公开市场上交易？

现实问题是，技术上可行、经济上有需求，但实现需要克服标准化和监管两大障碍。

市场需求确实存在：企业需要灵活采购算力、对冲价格波动、优化成本。算力中间商和转售市场已经在非正式形态中出现。但建立正式交易所需要两个前提：

第一，Token的标准化。交易所交易的商品必须是同质化的，但当前不同模型的Token品质差异巨大。需要建立“Token等级标准”（类似于原油品质分级），定义不同智能水平Token的可比性和互换比率。

第二，监管框架。 Token交易涉及金融属性（期货、衍生品），需要金融监管机构的认可和规则制定。

未来，更可能先出现的是“算力现货交易平台”，而不是交易所。类似于电力现货市场的撮合平台，让有闲置算力的企业和需要算力的企业直接对接。事实上，Together AI、Replicate等平台已经在扮演类似角色。

长期来看，完整的Token交易所（包含现货、期货、期权）可能在5-10年内出现，但它交易的标的物更可能是“标准化算力单位”（如GPU小时）而非“Token”本身——因为算力是可标准化的物理资源，而Token的异质性使其难以直接交易。Token定价将锚定在算力市场价格上，叠加各模型的“智能溢价”。

未来的竞争形态：“石油式”还是“电信式？”

当算力和Token越来越像一种基础商品，交易机制只是第一步。更进一步的问题是：这个市场会形成怎样的竞争格局，又会如何影响价格？

目前，两个常被援引的类比是“石油市场”和“电信市场” 。前者是OPEC式的卡特尔协调定价，后者是激烈的价格竞争。

我的理解更倾向于后者。因为Token市场不太可能出现OPEC式的卡特尔协调定价，原因有三：

第一，反垄断约束严格。AI行业处于全球监管焦点，任何显性的价格协调都会招致严厉的反垄断制裁。

第二，开源“搅局者”无法被纳入卡特尔。OPEC能够运作，是因为石油只有少数国家生产；但Token的“生产者”包括成千上万的开源部署者，这是一个无法被协调的群体。

第三，技术迭代速度太快。石油的开采技术变化缓慢，产量可预测；但AI领域一次技术突破就能改变供给格局，使任何协调定价迅速失效。

更可能的走向是电信市场式的“寡头价格竞争 + 非价格差异化”模式——少数巨头在Token基础价格上激烈竞争（类似中移动、联通、电信的流量价格战），同时通过增值服务（微调、安全、合规、专属支持）构建差异化。

但Token市场有一个电信市场不具备的特征：品质差异极大。

电信的1GB流量是标准化的，但不同模型的1000 Token智能密度差异巨大。这意味着Token市场可能发展为“分层级价格竞争”：每个智能层级内部激烈竞争，层级之间保持价格梯度。高端层级利润率高但竞争者少，低端层级利润率薄但竞争者多，中间层级最为动荡。

最终的格局，可能是“电信市场的竞争烈度 + 石油市场的品质分级 + 软件市场的版本策略” 的混合体，呈现出一种前所未有的市场形态。

碳排放：被忽视的外部性账单

还有一点需要强调的是，AI数据中心的碳排放问题，正在从科技公司的“内部尴尬”变成公开的行业危机。

谷歌发布的《2024年环境报告》显示，其碳排放量五年间上涨近五成；微软同年砸下逾百亿美元购买清洁能源，变相承认AI带来的能耗压力已难以遮掩。这些数字背后，是一个被长期忽视的问题：每一次AI调用，都有碳排放的代价。

Token消耗的碳排放外部性，应该被纳入定价吗？

从经济学原理看，碳排放是典型的“负外部性”，通过“碳税 + Token”模型将其内部化在理论上完全合理。AI数据中心已成为全球能源消耗增长最快的领域之一，如果不将环境成本纳入定价，市场将过度消耗Token——这是经典的“公地悲剧”。

但实操面临三重挑战：

第一，碳排放的归因复杂。一个Token的碳排放取决于数据中心的能源结构（风电还是煤电）、冷却效率、GPU利用率等多个变量，精确计量每个Token的碳足迹在技术上较为困难。

第二，竞争中立性。如果某些国家对Token征碳税而其他国家不征，AI算力将流向低监管地区，形成“碳泄漏”，需要国际协调。

第三，时机考量。 AI产业正处于关键发展期，过早征收碳税可能抑制创新，但过晚又会错过环境保护的窗口。

更可行的近期路径是“自愿披露 + 绿色标签”——要求AI公司披露Token的碳足迹信息，引入“绿色Token”认证标签（类似有机食品标签），让用户自行选择。中期引入碳排放配额交易，长期在国际协调框架下统一碳税标准。Token的碳定价不只是“要不要”的问题，而是“何时以及如何”的问题。

结语

回望这篇文章梳理的全部线索，我们会发现Token经济学其实是一个由多重张力构成的复杂图景：

寡头与开源的张力，决定了价格天花板的高度；价格竞争与品质分层的张力，决定了市场的竞争形态；效率与碳排放的张力，决定了外部性如何被内化；全球化与本地化的张力，决定了算力的地理分布；Token计费与按结果计费的张力，决定了商业模式的演化方向。

这些张力没有标准答案，它们在每一个时间节点上重新平衡，又在下一个技术突破、下一次政策调整、下一轮市场博弈中再次被打破。

Token经济学的剧本还在第一幕。技术在降价，开源在倒逼，监管在追赶，地缘在切割——每一股力量都在逐步去重塑这张定价表背后的权力结构。

在这个意义上，理解Token的定价、市场结构与未来趋势，本质上是在理解一种新型生产要素如何被嵌入到人类社会既有的经济、政治和文化秩序之中，形成智能经济新形态。而它的故事，才刚刚开始。

本文来自转载腾讯科技，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

DeepSeek降价背后：Token生意在重新洗牌

相关推荐

618前瞻：玩法相减，AI相加

豆包终究要回归免费

突发！Claude大面积宕机，用户竟收到「别人的对话」

别高估英伟达，别低估DeepSeek

Claude把病毒起源算错90年，都是网页惹的祸？

大模型首选格式Markdown，被30年前的工具取代了？

发表回复