上证指数 4043.64 0.37%
|
深证成指 15597.51 0.64%
|
恒生指数 23350.03 1.28%
|
纳斯达克 25832.67 -0.80%
|
日经225指数 69744.07 1.47%
|
以太坊信徒 站内编辑
2892 文章
6089427 阅读
首页  >  要闻 >  AI >  正文
申请成为签约作者 >
DeepSeek更新V4版AI模型 推理速度最高提升85%
2026年07月05日 12:22    
收藏  
举报

中国人工智能初创企业深度求索(DeepSeek)完成 V4 版本模型的核心工程升级,将推理速度最高提升 85%,同时大幅压低部署成本。

综合华尔街见闻与 IT 之家消息,6 月 27 日 DeepSeek 正式发布推测解码(Speculative Decoding)框架 DSpark,并同步开源全栈工具链 DeepSpec。本次推出的 DeepSeek-V4-Pro-DSpark 并非全新架构的新一代模型,而是在原有 DeepSeek-V4-Pro 基础上植入推测解码模块实现的效率优化,核心突破集中在工程落地层面,而非模型原生能力的代际迭代。

推测解码是大语言模型领域成熟的效率提升技术:在不改变模型输出结果的前提下,由轻量级 “草稿模型” 预生成候选 Token 序列,再交由主模型批量验证,以此规避大模型逐 Token 生成的算力损耗,实现推理提速。而 DeepSpec 覆盖数据准备、模型训练、草稿模型实现、性能评估全流程,可帮助开发者快速训练适配自身业务的推测解码模型,显著降低技术落地门槛。

据 DeepSeek 创始人梁文锋与北京大学联合发表的论文验证,DSpark 部署于 DeepSeek-V4 线上服务系统后,在真实用户流量场景下可有效减少无效验证带来的算力浪费,实现了生产环境中的真实效率增益。

这是 DeepSeek 完成 500 亿元人民币融资后,在 AI 推理效率赛道交出的首份公开成果,也凸显了公司的双线竞争策略:在持续追赶基础模型能力的同时,将算力效率与落地成本作为差异化竞争的核心抓手。

当前中国 AI 模型正沿着 “高性能 + 低成本” 的轻量化路径快速演进,这一趋势正在逐步撼动美国企业在全球大模型市场的长期主导地位。彭博社援引 OpenRouter 统计数据显示,截至 2026 年 6 月,谷歌、OpenAI、Anthropic 三家头部美企的 Token 请求份额已从一年前的 72% 骤降至 33%;而截至同年 3 月,中国 AI 模型的全球份额已突破 60%。

DeepSeek 选择将推测解码作为大额融资后的首个公开技术成果,是一次高度务实的市场化决策,也精准踩中了全球大模型产业的竞争拐点。

在基础模型通用能力逐渐进入收敛期、各家基准测试分数差距持续收窄的当下,推理效率与部署成本已经从技术参数变成了核心商业竞争力。85% 的推理提速,对应的是服务器算力成本的直接下降、用户响应体验的直观升级,这比实验室里零点几个点的跑分提升,更能转化为真实的客户付费意愿与市场份额。而 DeepSpec 的全栈开源,不止是技术分享,更是生态布局 —— 通过降低推测解码的落地门槛,让更多中小厂商共享效率红利,本质是在拉高整个中国 AI 阵营的成本基线,放大中国企业的工程化优势。

OpenRouter 的份额数据已经印证了这一趋势:全球 AI 市场正在从 “能力垄断” 的上半场,进入 “性价比竞争” 的下半场。美国厂商过去靠模型代差建立的技术溢价,正在被中国企业极致的工程优化快速稀释。但也要清醒看到,推测解码本质是成熟技术的工程化打磨,并非底层范式突破。美国企业在基础模型架构、前沿算法研究、高端算力供给等上游环节依然保有深厚壁垒,中国 AI 厂商当前的优势,更多集中在成熟技术的落地效率与成本控制上。

短期来看,工程化与性价比是中国 AI 企业抢占全球市场的利器;但长期而言,真正的行业话语权终究要靠底层技术创新来支撑。守住成本优势的基本盘,同时持续投入基础研究,才是从 “追赶者” 变成 “引领者” 的必经之路。

声明: 本文由入驻币海编者上传,观点仅代表编者本人,不代表币海财经赞同其观点或证实其描述,请自行判断。
延伸阅读
中国版Anthropic 智谱AI何以坐稳大模型第一股?
中国版Anthropic 智谱AI何以坐稳大模型第一股?
   鲁克        2026/06/22 15:01
DeepSeek首轮融资细节:复杂而矛盾的情绪
DeepSeek首轮融资细节:复杂而矛盾的情绪
   流动的沙        2026/06/18 13:36
中国AI的“去英伟达化”:一场提前到来的突围
中国AI的“去英伟达化”:一场提前到来的突围
   林天心        2026/05/13 11:55