深度解析:DeepSeek不差钱,为什么还要融500亿?

不是要500亿,是给DeepSeek重新定价。”              

某位多次接近梁文锋的顶级投资人曾无奈向雷峰网表示:梁文锋最讨厌两件事:跟VC吃饭,对外解释DeepSeek的决策。

这位幻方量化出身的程序员创业者,过去两年对所有找上门来的投资人说过同一句话——”VC的钱是负担”。腾讯来谈过,阿里来谈过,市面几乎每一家顶级风投都在他的闭门羹列表里。他觉得这些人都得帮LP赚钱,”所以谈不到一块去”。

而梁文锋确实有说这句话的底气。一位与梁文锋有过多次接触的大厂前副总裁曾和雷峰网透露,梁文锋有一笔规模在20到30亿的基金,这基金不用来对外募资,是自己的钱。而在另一名顶级资本人的口中,梁文锋曾对外表示他有四五万张卡,40、50亿是拿得出来的,不需要外部机构掏钱。

了解他的人说,他不是那种会跟VC称兄道弟的人。他出身量化交易,习惯用数学和逻辑做决策。DeepSeek成立至今,他接受过的专访一只手数得过来,每一篇都被AI圈翻来覆去地读——因为稀缺。

2026年4月24日,DeepSeek用一份58页的技术报告,发布了V4。万亿参数MoE架构,MIT协议全量开源,更重要的是,它从训练到推理全流程跑在华为昇腾上,不再依赖Nvidia芯片。

深度解析:DeepSeek不差钱,为什么还要融500亿?

图注:DeepSeek-V4 系列模型论文

这一天,OpenAI在同一天发布了GPT-5.5。梁文锋选的日子,不是巧合。

V4发布打消了市场上“DeepSeek技术不行了”的质疑。但真正让市场震惊的不是V4的技术指标,是一个月后,DeepSeek启动首轮外部融资。

这是中国AI公司有史以来最大的一轮融资,融资500亿。其中,梁文锋自己出200亿元,国家大基金领投。

01

一个月估值翻五倍:V4 重构了 DeepSeek 的价值

DeepSeek 的融资传闻在短短一个月内经历了戏剧性飙升。

DeepSeek的融资传闻,最早出现在4月中旬。据公开报道称,DeepSeek曾与投资人讨论过一轮融资,估值约100亿美元,融资规模约3亿美元,对应约3%股权。一个月后,融资金额暴涨至 500 亿元人民币,估值被推到450亿美元。

这个跳跃之间,真正改变市场定价逻辑的,是V4发布。

V4之前,市场看DeepSeek,更多是在看一家效率极高的模型公司:训练成本低,模型能力强,开源生态有影响力,是中国大模型公司里少见的技术黑马。

V4之后,市场看DeepSeek,已经不只是看一家模型公司,而是在看国产AI基础设施里最关键的模型节点之一,它率先走通“国产算力+大模型”的路径,完成“去英伟达化”。

英伟达CEO黄仁勋的评价很直接:“一旦 DeepSeek 率先在华为平台上发布,对美国而言将是灾难性的结果”。

02

500亿不是救命钱,而是估值锚点

DeepSeek的内部人员向雷峰网透露,梁文锋曾在内部明确表示:“我们不是因为缺钱才融资,而是需要一个明确的估值锚点,来兑现员工的期权价值。过去三年,大家跟着我一起打拼,付出了很多。我不能让大家的努力白费。”

这个说法很重要。 在此之前,他曾多次公开表示 “DeepSeek 不缺钱,短期内无融资计划”。

过去几年,DeepSeek员工手中的期权,可能是中国AI圈最难估值的资产。公司技术实力顶尖,开源模型被全球开发者广泛使用,但由于从未进行过外部融资,没有公开估值,也没有明确上市时间表,这些期权的真实价值始终是个谜。

早期,这不是问题。核心团队愿意为了“做出世界级模型”的共同目标接受这种不确定性。但当DeepSeek成为字节、腾讯、小米、阿里等大厂竞相挖角的“人才货架”时,问题开始凸显。

DeepSeek过去是挖人的一方。2024年前后,国内大模型圈流传一个说法:DeepSeek给钱很猛,也敢给年轻人机会。

一位顶级猎头曾对雷峰网说,早期只有DeepSeek去挖字节的人,很少听说字节能反向挖DeepSeek的人。还有机构给两位博士开到260万、270万元年包,DeepSeek直接在此基础上再加100万元。

这套打法在DeepSeek还没完全出圈时有效。因为那时加入DeepSeek,意味着能在小团队里直接碰核心模型,能发论文,能把名字写进技术报告,能参与国内最前沿的大模型训练。对顶尖研究员来说,这比在大厂做一颗螺丝钉更有吸引力。

但到了2025年之后,局面变了。

DeepSeek火了以后,它的人也变成了“明牌资产”。一个在DeepSeek参与过基座模型、推理模型、多模态、OCR的人,拿到市场上就是硬通货。字节、腾讯、小米、阿里都能给出确定的现金、签字费和总包。DeepSeek曾经用来吸引人才的技术光环,反过来把自己的人才推到了聚光灯下。

先拉一张名单。

王炳宣,DeepSeek第一代大语言模型核心作者,去了腾讯。罗福莉,V3模型核心贡献者,雷军开的价——千万年薪,去了小米。郭达雅,R1核心研究员,去了字节跳动Seed团队,传闻总包近亿元。多模态技术核心研究员阮翀已加入自动驾驶科技公司元戎启行,OCR 系列核心作者魏浩然也已经离职。

深度解析:DeepSeek不差钱,为什么还要融500亿?

图注:DeepSeek近期离职人员名单

从2025年下半年到2026年初,不到半年,走了五个人。

DeepSeek总共不到200人。核心研究团队100多人。基模架构团队——真正做模型本体的人——只有小几十人。

五个人走了,至少两条技术线断档。

DeepSeek 一直以 “小团队、高效率” 著称,但小团队的弱点也同样明显:任何一个关键人离开,影响都会被无限放大。万人大厂走几个研究员可能只是组织波动,但对 DeepSeek 来说,连续走掉几个核心作者,就意味着某条技术线要从头重组。

更麻烦的是,DeepSeek 的核心竞争力恰恰建立在“人和系统的强耦合”上。它不是简单堆卡,也不是照搬已有框架,而是在模型结构、训练策略、通信优化、推理成本上做了大量独特的工程取舍。DeepSeek-V2论文里提到的MLA、DeepSeekMoE等设计,本质上就是算法、系统和硬件约束共同优化的结果。

一个研究员离开,带走的不只是代码和论文里的显性成果,还有大量没有被完整文档化的隐性经验:哪些训练策略试过但失败了,哪些通信优化在特定硬件上有效,哪些模型结构看起来漂亮但工程上跑不通。这些东西很难写进论文,却决定了一家公司能不能持续推出前沿模型。

所以,DeepSeek 真正要解决的,不只是薪酬问题。总包可以谈,签字费可以加,但最致命的问题是:DeepSeek 的期权没有市场化定价锚点。

理想可以让人上车,但只有明确的价格,才能让人长期坐稳。融资,就是给未来标价。

一位 AI 创业公司合伙人对雷峰网表示,DeepSeek 这轮融资本质上是一场 “OpenAI 式的期权重估”。OpenAI 早年也经历过完全相同的困境:大量研究员为了理想加入,但随着公司估值飙升和商业化加速,如何让核心人才分享公司增值,成为组织稳定的关键变量。最终,OpenAI 通过多轮融资和二级交易,让员工股权获得了可参照的市场价格。

03

梁文锋自己出200亿,背后的三种解读

这轮融资里最有戏剧性的部分,DeepSeek这次500亿的融资,梁文锋自己出了200亿,占本轮融资总额的40%。

对此,业内资深人士向雷峰网给出了三种解读。

第一,给期权定价。

如果公司需要的是500亿现金来发工资搞研发,梁文锋自己出200亿就够了——国家大基金和腾讯是“陪跑”。

说明DeepSeek真正需要的不是500亿现金,而是“500亿”这个数字本身。一个经过市场验证的估值锚点。有了这个锚点,员工手里的期权的公允价值是多少,就能算清楚了。

梁文锋自己出200亿,等于给员工上了一道保险:你看,我自己都all in了。

第二,不想被稀释。

梁文锋持有84.29%的股份,拥有几乎100%的表决权。这是他过去两年拒绝所有VC的根本原因。自己出最大份额,控制权基本不变。国家大基金进来是战略合作,不是来抢董事席位的。

第三,对赌。

大基金领投意味着一个底层的交换:算力自主战略需要DeepSeek跑在最前面,DeepSeek需要国家的资源和市场准入。梁文锋自己出200亿,等于在说:这是我的钱,我输得起,也一定会赢。

04

算力自主:500亿真正的战场

500亿估值的底层逻辑,不再是模型本身,而是“算力主权”。

过去几年,美国持续收紧对中国的先进AI芯片出口管制。美国商务部工业与安全局BIS多次更新先进计算芯片出口规则,限制包括A100、H100及其降规版本在内的高端芯片对华销售。

这直接改变了中国大模型公司的底层假设。

以前大家默认,最强模型跑在英伟达生态上,CUDA是事实标准,H100是核心军火。但当高端芯片买不到,或者买到的是受限版本时,中国AI公司必须面对一个现实:不能永远把命门放在别人手里。

DeepSeek的特殊价值就在这里。

它不是单纯喊国产替代,而是在做一条更现实的路线:用算法效率、模型结构和系统工程,弥补硬件短板。

DeepSeek-V2通过MoE架构降低推理成本,DeepSeek-R1用强化学习做推理能力增强,这些都指向同一个方向:不跟OpenAI、Anthropic硬拼“无限算力”,而是在受约束条件下把效率榨干。

V4进一步把这条路线推到产业层面。

一位接近梁文锋的业内人士雷峰网透露,V4发布后,华为云迅速完成适配。多位算力产业人士认为,DeepSeek在昇腾平台上的模型适配,不只是一次普通的云服务支持,而是对国产AI算力系统的一次高强度验证。

某大模型公司创始人对雷峰网说,美国对H800等芯片通信能力的限制,本质上像是把原本连在一起的GPU拆成一个个孤岛;DeepSeek的办法是绕开部分既有依赖,自己做底层调度和优化,把这些“孤岛”重新组织起来。

他指出,这也是DeepSeek引发英伟达股价波动的原因之一:外界突然意识到,AI不一定只能沿着CUDA和最贵GPU那条路走。

这段判断未必能解释全部市场波动,但它说中了一个行业焦虑:英伟达真正强的不是单块GPU,而是GPU、CUDA、网络、开发者生态组成的整体系统。CUDA长期是AI开发事实标准,国产算力真正难的,也不只是芯片参数,而是软件栈、算子、通信、框架和开发者生态。

如果DeepSeek能在国产算力上跑通强模型,它的价值就不只是“模型公司”,而是国产AI基础设施的验证器。资本市场看懂了这个事实,500亿看起来像融资,其实更像给“算力自主”买保险。

买芯片、建集群、改框架、做算子、训模型、跑推理、服务百万级用户,每一步都是吞金兽。尤其是从实验室跑通,到商业化稳定服务,中间隔着一整条工程峡谷。

这不是梁文锋一个人靠幻方分红就能优雅解决的事。

05

拿到500亿后,DeepSeek会变成什么?

DeepSeek 过去最迷人的地方,是它不像一家大公司。它小、狠、技术味浓,敢开源,也敢用低价 API 掀桌子。2024 年 DeepSeek-V2 上线后,API 价格大幅低于当时主流闭源模型,引发阿里、字节等玩家跟进降价,国内大模型价格战由此加速。

但 “黑马”状态不能永远持续。当 DeepSeek 被放到全球 AI 竞争和国产算力自主的大背景里,它就必须变成一个系统:有人才梯队,有股权激励,有稳定算力,有产业合作,有长期资金。

这也是这轮融资最值得关注的地方。它不是简单从“不融资”变成“融资”,而是 DeepSeek 从实验室文化向平台型组织转变的信号。

梁文锋过去可以讨厌 VC,因为 DeepSeek 还可以靠技术奇袭赢得注意力;但现在,DeepSeek 要面对的对手不是某一家创业公司,而是 OpenAI、Google、Anthropic、Meta,以及它们背后的云、芯片、资本和客户网络。

在这种牌桌上,单靠 “技术好” 是不够的。技术领先会带来关注,关注会带来挖人,挖人会逼你重估激励;模型变强会带来用户,用户会带来推理成本,推理成本会逼你掌握算力;开源会带来生态,生态会带来责任,责任会逼你找更大的资源同盟。

这就是 DeepSeek 现在的处境。它不差钱,但它缺一个能把人才、估值、算力、产业资源全部锁在一起的结构。500 亿,买的就是这个结构。

融资之后,DeepSeek 至少会面对四个变化:

  1. 人才激励体系重做:核心员工期权需要重估,也可能出现更清晰的回购、兑现或追加授予机制。过去靠理想和技术荣誉凝聚团队,未来必须叠加财富机制。
  2. 算力投入系统化:DeepSeek 如果要继续在国产算力上推进模型训练和推理,就不能只靠临时适配,而要建立长期的基础设施团队,和芯片、云、框架厂商形成更紧密协作。
  3. 开源和商业化重新平衡:DeepSeek 过去靠开源建立影响力,但大规模推理服务需要成本覆盖。未来它仍会保持技术开放,但商业化节奏大概率会更清晰。
  4. 从技术黑马变成基础设施级玩家:OpenAI 背后有微软,Anthropic 背后有亚马逊和 Google,xAI 背后有马斯克的资本和基础设施。DeepSeek 如果继续留在全球牌桌上,也必须拥有自己的资源同盟。

梁文锋以前最不愿意讲故事。DeepSeek 的很多关键时刻,他都没有站出来。模型发布靠技术报告,产品更新靠公告,外界想理解它,只能去读论文、扒代码、看社区测评。

这很梁文锋,也很 DeepSeek。

但这一次,他主动走进了牌局,不是来讲故事的。

本文来自转载雷锋网 ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
Hermes 终于支持原生 Windows 了!
上一篇 3小时前
AI突现首例自我复制!横跨4国160小时无限繁殖
下一篇 1小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论