今早 AI 圈最大的震动,莫过于 DeepSeek 正式打破 "永不融资" 的铁律。据 The Information 独家爆料,这家幻方量化旗下的 AI 独角兽正寻求以不低于 100 亿美元的估值,筹集至少 3 亿美元的外部资金。
这不仅是梁文锋从技术理想主义向商业现实的关键妥协,更是全球 AI 格局即将迎来重大转折的信号 ——DeepSeek 正用一场 "融资 + 国产芯片" 的组合拳,试图彻底摆脱对英伟达生态的依赖。

为什么是现在?V4 箭在弦上,竞争已到临界点
DeepSeek 上一次震撼全球还是 2025 年初的 R1,此后行业已经等了整整一年半。V4 原定今年 2 月发布却多次跳票,最新消息指向4 月底正式亮相。
延期的核心原因并非模型本身,而是一场史无前例的底层硬件大迁移:V4 将完全基于华为最新的昇腾芯片训练和运行。DeepSeek 工程师投入了大量时间重写核心代码,从英伟达 CUDA 生态全面迁移到华为 CANN 架构,并且刻意没有给英伟达和 AMD 提供提前优化的权限。
与此同时,AI 竞赛的烧钱速度正在指数级上升。斯坦福 2026 年度 AI 指数报告显示,中美顶级模型的性能差距已缩小至 2.7 个百分点,越往后追赶的边际成本越高。就在本月,OpenAI 刚以 3000 亿美元估值完成 400 亿美元融资。即便是以 "花小钱办大事" 著称的 DeepSeek,也无法仅靠幻方一家持续输血。
此次融资的资金将主要用于扩充算力储备和留住顶尖人才,为 V4 的大规模部署和后续迭代提供弹药。不过受地缘政治影响,美国风投对这家中国公司的态度普遍谨慎。
V4:万亿参数的国产 AI 巅峰之作
从目前泄露的信息来看,V4 的技术规格全面超越前代,野心直指全球第一梯队:
万亿参数 MoE 架构:总参数约 1 万亿,单 token 仅激活 370 亿参数,推理成本与 V3 持平,延续了 DeepSeek 效率优先的核心优势
100 万 token 超长上下文:搭载独创的 Engram 条件记忆架构,实现恒定时间检索,100 万 token 长度下信息召回率高达 97%
首个原生多模态模型:支持文本、图像和视频生成,补齐了 DeepSeek 长期以来的短板
代码能力全球领先:内部测试 SWE-bench 成绩超 80%,HumanEval 达 90%,可处理整个代码仓库级别的复杂 bug 修复,长上下文代码推理能力预计超越 Claude 和 GPT 系列
V4 将分两个版本发布:完整版针对高级推理和复杂代码任务优化,专为华为昇腾芯片定制;轻量版约 2000 亿参数,面向通用对话和 API 服务,可在多款国产芯片上运行。值得一提的是,DeepSeek 将继续坚持开源路线,以 Apache 2.0 协议开放 V4 权重。
目前 V4 已完成实验室阶段,正在进行大规模部署前的最后准备。3 月 "V4 Lite" 曾短暂上线后被撤下,4 月初 API 节点已出现测试版本,推理速度提升 30%,128K 上下文召回率从 45% 跃升至 94%。DeepSeek 近期还在乌兰察布大规模招聘算力基础设施驻场人员。

英伟达 CEO 黄仁勋近期直言,DeepSeek 基于华为平台的新模型 "对美国来说将是一个糟糕的结果"。这句话道出了此次事件的真正分量。
如果 V4 在华为昇腾芯片上跑出有竞争力的性能,它将成为全球第一个不依赖英伟达的前沿 AI 大模型。这意味着美国通过芯片垄断控制 AI 产业的护城河,第一次出现了实质性的缺口。
DeepSeek 的 3 亿美元融资,表面上是为了支撑 V4 的研发和部署,实际上押注的是 "国产芯片 + 开源模型" 这条完全独立于美国的 AI 发展路线。

DeepSeek 这次打破不融资的决定,是理性且必要的战略选择,而非单纯的商业妥协。在 AI 竞赛进入 "烧钱 + 算力" 的下半场,单打独斗已经不可能跟上巨头的步伐。保留核心独立性的同时引入外部资本,是平衡理想与现实的最佳方案。
更重要的是,DeepSeek 选择了一条最艰难但也最有价值的道路:与国产芯片深度绑定,打造完整的自主可控 AI 全栈。这比单纯在模型性能上追赶 OpenAI 意义更为深远。它不仅为中国 AI 产业找到了一条摆脱卡脖子的出路,也为全球提供了一个不同于英伟达垄断的替代方案。
当然,挑战依然巨大。华为昇腾的生态成熟度与英伟达还有差距,大规模部署后的稳定性和成本控制都需要时间验证。同时,地缘政治风险始终悬在头顶,美国可能会采取进一步的限制措施。
但无论如何,DeepSeek 已经迈出了历史性的一步。如果 V4 能够如期发布并达到预期性能,它将不仅是 DeepSeek 的胜利,更是整个中国 AI 产业的里程碑。从此,全球 AI 格局将真正进入中美双雄并立的时代。



