估值 100 亿美元的 DeepSeek 在 V4 发布前夕至少融资 3 亿美元

公告：“业余草”微信公众号 AI 中转站提供免费体验，点击链接 https://unity2.ai/register?ref=3XTnndN2 进行访问，支持 Claude、ChatGPT、Gemini 等最新模型！关注业余草微信公众号，添加作者微信：xttblog2！
本博客日IP超过2000，PV 3000 左右，急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包，请加博主新的微信号：xttblog2，之前的微信号好友位已满，备注：返现
受密码保护的文章请关注“业余草”公众号，回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽，请关注文末小程序
视频教程免费领

【腾讯云】1核2G5M轻量应用服务器50元首年，高性价比，助您轻松上云

估值 100 亿美元的 DeepSeek 在 V4 发布前夕融资 3 亿美元。

AI 圈一直很热闹，也一直不缺话题。在过去的两天，Claude 和 Codex 分别迎来了更新，尤其是 Cluade 4.7 版本发布之后，迎来了一波批评之声。

国内的 AI 发展也很迅猛，这两天关于 DeepSeek 也露出了不少有用消息。一个是 DeepSeek 悄悄的更新了 DeepGEMM 代码库，根据代码库的提交可知，Mega MoE、FP4 Indexer 也来了。

另一个消息是，DeepSeek 突然放开了对外融资，以估值 100 亿美元的价格，至募资 3 亿美元。

这是 DeepSeek 首次且正式的启动首轮融资，我估计 DeepSeek 并不缺投资者，腾讯、阿里等早就想投了，一直没机会。

这次的募资金额也不多，估计不够抢。要知道在中国 AI 赛道，智谱最新估值约 4000 亿港元，MiniMax 约 2700 亿港元，而 DeepSeek 这位曾经的“开源王者”终于从幻方量化的“私房菜”走向了资本市场的聚光灯下了。对比来看，DeepSeek 的 100 亿美元估值，只能说是太便宜了。

但我觉得相比融资数字更值得关注的，是 DeepSeek V4 的“迟到”，以及它背后那场静默的“心脏移植手术”（换芯）。

DeepSeek 为何转变？

DeepSeek 曾是 AI 圈最“佛系”的存在。此前，它多次拒绝国内顶级 VC 和科技巨头的投资邀约，依靠母公司幻方量化“自我供血”。这种模式下，DeepSeek-R1 以极低成本震撼全球，成为打破美国技术封锁的第一个成功样本。

但 2025 年以来，形势变了。

首先是人才流失。核心研究员罗福莉加入小米，郭达雅跳槽字节，薪资大幅提升。其次是算力焦虑。当全球巨头进入“月更模式”，DeepSeek 却因算力不足屡屡出现服务器“繁忙”。更重要的是，对手太有钱了，OpenAI 估值 1500 亿美元，Anthropic、Google DeepMind 持续重金投入，大模型竞赛已成资本密集型战争。

文章配图参见 https://mp.weixin.qq.com/s/C1Ax0WwTmLJtM7dbolAguA。

这 3 亿美元，是 DeepSeek 拿到的全球 AI 总决赛入场券。不是奖杯，是门票。

V4 难产是国产芯片适配的代价

如果说融资是面子，那么 V4 的延迟就是里子。据接近 DeepSeek 的人士透露，团队核心精力不在刷榜，而在一场“底座大迁移”，将万亿参数 MoE 架构从英伟达 CUDA 生态整体迁移至国产算力栈（华为昇腾为代表）。

业内有个残酷的比喻，给一个正在跳动的心脏换腔体。

2025 年初，DeepSeek 曾尝试用华为昇腾 910C 芯片训练下一代模型，但遭遇多重技术障碍。训练稳定性不足、大规模分布式场景下频繁崩溃、芯片间通信速度未达预期。华为派遣工程师团队现场支持，最终仍未能解决训练阶段的适配问题。

结果是妥协性的，训练阶段继续切回英伟达 GPU，昇腾芯片仅用于推理环节。这意味着，至少在训练这一核心环节，DeepSeek 用了近一年时间在试错。

但适配工作并未停止。2026 年，V4 版本传出新动向：DeepSeek 没有提前给英伟达开放测试权限，反而优先把预发布版本交给华为新一代昇腾 950PR 芯片做适配，同时同步适配寒武纪芯片以分散风险。

这次的目标更彻底，从底层代码层面完成迁移，从 CUDA 生态全面迁移至华为 CANN 框架，实现训练与推理全链条的国产化替代。

回想，我之前写的这篇《https://mp.weixin.qq.com/s/G-BO7DnvYV_sH1NjFlIMfw》 10 万+，还是我格局小了，原来 DeepSeek 一直在根上突破。

慢是掉速，还是蓄力？

当全球主流厂商保持 2 到 3 个月模型迭代节奏时，DeepSeek 却越来越慢。这种“慢”带来了什么？

首先是技术层面，V4 reportedly 在多项基准测试中表现亮眼。MMLU-Pro 91.2（力压 GPT-5.3 的 88.4）、AIME 2025 96.4、SWE-bench Verified 59.6。更重要的是，V4 将押注多模态、长期记忆、代码能力跃升，还要深度适配国产芯片。

其次是战略层面，DeepSeek 正在承担超越一家创业公司的使命。2025 年 2 月，梁文锋参加民营企业座谈会，坐在第一排与马化腾、任正非、雷军并肩。这种象征意义，让 DeepSeek 从一家技术公司变成了国家自主可控战略棋局上的关键棋子。

最后是产业层面，阿里、字节、腾讯均已向华为下单数十万颗昇腾 950PR 芯片。一种合理的猜测是，头部云厂商在等待 DeepSeek V4 的验证结果，以评估国产芯片在大规模 AI 训练中的实际可用性。若 V4 成功跑通，华为 950PR 将从技术样品转化为可商用产品；若未能达到预期，相当于为行业探明了当前国产芯片的能力边界。

百亿估值的真正含义

100 亿美元，是 DeepSeek 彻底告别“幻方量化私房菜”时代的分水岭。

外部资本进入，意味着对冲基金式的灵性探索，必须向工业化大规模生产转型。资本真正看中的，不是那几列柱状图，而是 DeepSeek 已验证的Token 边际成本控制能力。

当硅谷还在为几美分的推理成本纠结时，DeepSeek 的逻辑是，如果不能把 Token 成本打到电费级，大模型的商业化就是一场集体的自嗨。

但挑战同样明显，在开源生态中，维持“代际领先”的压力远比闭源巨头更高。一旦 V4 仅微增性能却抬高推理成本，DeepSeek 的神话可能就会面临破灭。

在无人区，慢就是快

DeepSeek 正在进入国产大模型真正的“无人区”。前方没有参照物，只有日益收紧的算力封锁，和步步紧逼的硅谷巨头。

对 V4，我们不妨少一点道德绑架，多一点产品经理的耐心，给它时间去调优那个尚不完美的国产底座，给它空间去消化百亿美金带来的重量。

2026 年，我们需要英雄，但更需要能走出手术室、继续跑下去的幸存者。V4 不必成神，它只需成基。

我是非常看好 DeepSeek 的，支持 DeepSeek 在芯上的布局与投入，以及即将推出的 V4 版本。

业余草公众号

最后，欢迎关注我的个人微信公众号：业余草（yyucao）！可加作者微信号：xttblog2。备注：“1”，添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注！后续有精彩内容会第一时间发给您！原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系！

本文原文出处：业余草： » 估值 100 亿美元的 DeepSeek 在 V4 发布前夕至少融资 3 亿美元

一	二	三	四	五	六	日
« 6月
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DeepSeek 为何转变？

V4 难产是国产芯片适配的代价

慢是掉速，还是蓄力？

百亿估值的真正含义

在无人区，慢就是快

相关文章推荐