Java基础、中级、高级、架构面试资料

估值 100 亿美元的 DeepSeek 在 V4 发布前夕至少融资 3 亿美元

业余杂谈 herman 9浏览
公告:“业余草”微信公众号提供免费CSDN下载服务(只下Java资源),关注业余草微信公众号,添加作者微信:xttblog2,发送下载链接帮助你免费下载!
本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
视频教程免费领
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云

估值 100 亿美元的 DeepSeek 在 V4 发布前夕融资 3 亿美元。

AI 圈一直很热闹,也一直不缺话题。在过去的两天,Claude 和 Codex 分别迎来了更新,尤其是 Cluade 4.7 版本发布之后,迎来了一波批评之声。

国内的 AI 发展也很迅猛,这两天关于 DeepSeek 也露出了不少有用消息。一个是 DeepSeek 悄悄的更新了 DeepGEMM 代码库,根据代码库的提交可知,Mega MoE、FP4 Indexer 也来了。

另一个消息是,DeepSeek 突然放开了对外融资,以估值 100 亿美元的价格,至募资 3 亿美元。

这是 DeepSeek 首次且正式的启动首轮融资,我估计 DeepSeek 并不缺投资者,腾讯、阿里等早就想投了,一直没机会。

这次的募资金额也不多,估计不够抢。要知道在中国 AI 赛道,智谱最新估值约 4000 亿港元,MiniMax 约 2700 亿港元,而 DeepSeek 这位曾经的“开源王者”终于从幻方量化的“私房菜”走向了资本市场的聚光灯下了。对比来看,DeepSeek 的 100 亿美元估值,只能说是太便宜了。

但我觉得相比融资数字更值得关注的,是 DeepSeek V4 的“迟到”,以及它背后那场静默的“心脏移植手术”(换芯)。

DeepSeek 为何转变?

DeepSeek 曾是 AI 圈最“佛系”的存在。此前,它多次拒绝国内顶级 VC 和科技巨头的投资邀约,依靠母公司幻方量化“自我供血”。这种模式下,DeepSeek-R1 以极低成本震撼全球,成为打破美国技术封锁的第一个成功样本。

但 2025 年以来,形势变了。

首先是人才流失。核心研究员罗福莉加入小米,郭达雅跳槽字节,薪资大幅提升。其次是算力焦虑。当全球巨头进入“月更模式”,DeepSeek 却因算力不足屡屡出现服务器“繁忙”。更重要的是,对手太有钱了,OpenAI 估值 1500 亿美元,Anthropic、Google DeepMind 持续重金投入,大模型竞赛已成资本密集型战争。

文章配图参见 https://mp.weixin.qq.com/s/C1Ax0WwTmLJtM7dbolAguA

这 3 亿美元,是 DeepSeek 拿到的全球 AI 总决赛入场券。不是奖杯,是门票。

V4 难产是国产芯片适配的代价

如果说融资是面子,那么 V4 的延迟就是里子。据接近 DeepSeek 的人士透露,团队核心精力不在刷榜,而在一场“底座大迁移”,将万亿参数 MoE 架构从英伟达 CUDA 生态整体迁移至国产算力栈(华为昇腾为代表)。

业内有个残酷的比喻,给一个正在跳动的心脏换腔体

2025 年初,DeepSeek 曾尝试用华为昇腾 910C 芯片训练下一代模型,但遭遇多重技术障碍。训练稳定性不足、大规模分布式场景下频繁崩溃、芯片间通信速度未达预期。华为派遣工程师团队现场支持,最终仍未能解决训练阶段的适配问题。

结果是妥协性的,训练阶段继续切回英伟达 GPU,昇腾芯片仅用于推理环节。这意味着,至少在训练这一核心环节,DeepSeek 用了近一年时间在试错

但适配工作并未停止。2026 年,V4 版本传出新动向:DeepSeek 没有提前给英伟达开放测试权限,反而优先把预发布版本交给华为新一代昇腾 950PR 芯片做适配,同时同步适配寒武纪芯片以分散风险。

这次的目标更彻底,从底层代码层面完成迁移,从 CUDA 生态全面迁移至华为 CANN 框架,实现训练与推理全链条的国产化替代。

回想,我之前写的这篇《https://mp.weixin.qq.com/s/G-BO7DnvYV_sH1NjFlIMfw》 10 万+,还是我格局小了,原来 DeepSeek 一直在根上突破。

慢是掉速,还是蓄力?

当全球主流厂商保持 2 到 3 个月模型迭代节奏时,DeepSeek 却越来越慢。这种“慢”带来了什么?

首先是技术层面,V4 reportedly 在多项基准测试中表现亮眼。MMLU-Pro 91.2(力压 GPT-5.3 的 88.4)、AIME 2025 96.4、SWE-bench Verified 59.6。更重要的是,V4 将押注多模态、长期记忆、代码能力跃升,还要深度适配国产芯片。

其次是战略层面,DeepSeek 正在承担超越一家创业公司的使命。2025 年 2 月,梁文锋参加民营企业座谈会,坐在第一排与马化腾、任正非、雷军并肩。这种象征意义,让 DeepSeek 从一家技术公司变成了国家自主可控战略棋局上的关键棋子

最后是产业层面,阿里、字节、腾讯均已向华为下单数十万颗昇腾 950PR 芯片。一种合理的猜测是,头部云厂商在等待 DeepSeek V4 的验证结果,以评估国产芯片在大规模 AI 训练中的实际可用性。若 V4 成功跑通,华为 950PR 将从技术样品转化为可商用产品;若未能达到预期,相当于为行业探明了当前国产芯片的能力边界。

百亿估值的真正含义

100 亿美元,是 DeepSeek 彻底告别“幻方量化私房菜”时代的分水岭。

外部资本进入,意味着对冲基金式的灵性探索,必须向工业化大规模生产转型。资本真正看中的,不是那几列柱状图,而是 DeepSeek 已验证的Token 边际成本控制能力

当硅谷还在为几美分的推理成本纠结时,DeepSeek 的逻辑是,如果不能把 Token 成本打到电费级,大模型的商业化就是一场集体的自嗨。

但挑战同样明显,在开源生态中,维持“代际领先”的压力远比闭源巨头更高。一旦 V4 仅微增性能却抬高推理成本,DeepSeek 的神话可能就会面临破灭。

在无人区,慢就是快

DeepSeek 正在进入国产大模型真正的“无人区”。前方没有参照物,只有日益收紧的算力封锁,和步步紧逼的硅谷巨头。

对 V4,我们不妨少一点道德绑架,多一点产品经理的耐心,给它时间去调优那个尚不完美的国产底座,给它空间去消化百亿美金带来的重量。

2026 年,我们需要英雄,但更需要能走出手术室、继续跑下去的幸存者。V4 不必成神,它只需成基。

我是非常看好 DeepSeek 的,支持 DeepSeek 在芯上的布局与投入,以及即将推出的 V4 版本。

业余草公众号

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!

本文原文出处:业余草: » 估值 100 亿美元的 DeepSeek 在 V4 发布前夕至少融资 3 亿美元