从不限量到自费上班，互联网公司们付不起Token账单了

资讯组小编 • 文章来源: 微信公众号 “Tech星球” • 1小时前 • 新闻

全员Token-maxxing（把Token用量拉到极限）还没俩月，互联网公司急速调转船头。

6月5日，腾讯已在内部宣布调整 AI Token 额度。核心的变化是，全员统一额度改为按工作任务动态调配。通知明确表示，总投入只增不减，对能用 AI 带来显著提效和价值产出的同学，保障 Token 额度，不搞 Token 消耗量排名，不贩卖焦虑。

大公司们对Token额度的快速消耗甚至超过了他们自己的预期。

今年4月，Uber首席技术官普拉文·纳加（Praveen Naga）表示，公司在4个月内就将2026年的AI预算花光了，Uber 2025年的研发支出达到34亿美元。Meta员工在30天内消耗了60.2万亿个AI token，成本超过了1亿美元。

国内亦是如此。5月20日，《崩坏》系列 AI NPC & Gameplay 技术团队负责人郑银河透露，有员工为了实现项目，建了几十个 Agent 共同协作，结果一晚上烧了价值 200 万元的 Token。

曾经，为了践行AI策略，不少公司希望员工最大程度去调用AI工具，甚至搞Token用量排名，以此作为升职、加薪的标准之一，但当看到天价Token账单后，互联网公司们懵了。

3天用掉90%额度，大厂狂砍Token用量

腾讯此次Token额度动态调整并没有提前通知，这让一些员工感到措手不及。一位腾讯研发人员称，自己根本不够用，发布通知到当天，就发现自己有10%的额度了，用claude就是挺不住得烧。

Tech星球了解到，此次调整涉及到包括实习生、外包、正式员工在内的所有人员。目前，只有混元大模型对所有人免费。这样的调整在一些人看来在情理之中。“用脚指头想也知道，怎么可能一直超多超量供应”，一位腾讯员工评论道。

一位腾讯大数据方向的外包员工告诉Tech星球，以前他们使用大模型是积分制，有100000积分，就没有关注具体Token量，但是够一个月使用。现在外包只能申请混元大模型，混元是没有Token限制的。

但混元在所有基础大模型中表现并不优异。凭借在“强推理+256K超长上下文”的能力，Hy3 preview曾连续登顶OpenRouter全球周榜，但整体能力上，尤其复杂任务时，比如编程等，Hy3 和DeepSeek V4 Flash、Claude Sonnet 4.6等模型依然存在差距。

但Token的调整对每个事业部每个人的体感不一样，有人只剩100美元，有人则有1万多元人民币。

一位腾讯实习生告Tech星球，调整前，自己只有100美元，调整后算起来有200美元了，市面上的先进模型都能用，但200美元确实不够用，写代码的话一天多的时候就能用50美元。一位腾讯AI预研游戏员工称，自己目前还有12600元，而同事有2.1万元。还有一些人则表示，Token直接砍半了。

一位腾讯后端研发称，虽然目前Token额度有所缩减，但自己所在的组并不受影响，不够就可以向上级申请。

此前，腾讯传出为每位员工发放价值约22万元的Token套餐。按照腾讯集团2026年Q1财报中提到的114848名员工计算，腾讯每年需要支付252亿元费用。作为对比，其2025年的研发费用为857.5亿元。

但现在，即便是财大气粗的腾讯也要开始算细账了，而这只是行业的缩影。Tech星球了解到，国内主流大厂都会要求员工优先使用内部大模型，内部大模型对员工基本免费，甚至一些公司还屏蔽了竞对的模型。但是最终内部模型产出的效果可能依然比不上海外模型。

一位字节跳动员工向Tech星球介绍，公司内部并不强制用AI，“Token额度对大厂是很大的负担，不少互联网公司不同岗位不同部门额度存在差异，并且在字节如果AI相关的技术研发岗位如果额度不够，还可以内部审批去外面单独采购”，他补充道。

一位美团员工表示，并没有听到内部会有额度限制，但自己的额度是完全够用的。一位百度员工则称，内部根据部门不同额度限制的情况也会有差异。

破除Token盲目崇拜

大厂或者还在犹豫是否削减Token额度，但更多中小型互联网公司已经撑不住了。

广州一家做跨境支付的企业决定削减员工的Token用量：从上不封顶到人均每月500美元。而此前一个月，他们消耗掉了40万美元的Token。

“这完全不够用了”，上述公司的一位程序员告诉Tech星球。他所在的公司竟然出现互相借Token想象，比如一位后端开发者2天就消耗掉370美元的Token，额度报警，该开发者开始向他借Token用。

以前大大小小的互联网公司们践行Token-maxxing，生怕错过AI浪潮。于是，员工们拼命研究如何消耗Token。一位上述员工分享道，尤其后端程序员，研发了各种封装包、skill，每个业务有一堆提效工具，一些程序员一开就是好几个agent，一小时就能烧掉上亿Token。这导致新规发布前，一些程序员就已经超出预算1000多美元。消耗1亿Token，如果使用目前编程主流选择Claude Sonnet 4.6，需要至少花费2000元，最高甚至达到1万元。

事实上，Token浪费的情况确实存在。一位新能源汽车员工称，公司每个月给他1000美元的Token额度，他根本用不完，为了消耗，只能用AI写原创小说，比如续写《红楼梦》。

上海某老牌互联网公司员工告诉Tech星球，公司以前是不限的，但现在公司开始统一管理大家的Token额度，每个人都需要走钉钉审批申请Token，每个人的额度是几百元到1000元不等。

这样的情况开始变得普遍。北京某腰部互联网公司员工称，原来大家可以不限额使用Claude Code，公司报销。现在是开放了Anthropic的API接口，每个人每月是1000元额度，并且让大家优先使用更便宜的国产大模型。

但现实是，便宜的大模型只能胜任一些简单的代码补全类任务，一旦遇到复杂任务，需要多轮次反复交互，甚至不如自己手搓。“我现在已经开始自己买额度了，1000元的额度可能根本用不了一周。”

一些公司则要求全栈AI化，这导致Token用量大幅度上升。广州某游戏公司员工称，之前Token全员免费，自己一个月用了小3万Token，部门人人超标，之后就只能用DeepSeek的模型了。

上海一位程序员在社交平台分享道，自己的部门只有4个人，但一个月就消耗掉了6万元Token。现在技术老大直接采买了DeepSeek的Token让技术切换。

Token-maxxing的另外一个结果是，在复盘的时候，不少程序员发现看不懂自己写的代码，甚至都找不到代码在哪里，为什么要这么写。公司的管理者们发现，即便使用了AI，整体的运营效率并没有提升，甚至当大模型需要排队时，反而影响重要产品的节奏。

百度创始人李彦宏在今年的AI开发者大会上首次提出日活智能体数（Daily Active Agents，简称DAA），DAA大致对应移动互联网时代通用的日活用户数（DAU）,它看起来，比单纯看Token消耗量更能体现平台和生态真实繁荣程度的度量。

从不设上限的肆意挥霍，到如今精打细算的“配额制”与“国产替代”，互联网公司对AI的盲目崇拜正在经历一场必经的祛魅。

本文来自转载微信公众号 “Tech星球” ，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。