英国媒体称,中国人工智能起步公司深度求索(DeepSeek)的R2模型,因使用华为芯片训练遇到问题而推迟发布。
路透社引述英国《金融时报》报道,多名消息人士称,DeepSeek在1月发布R1型号后,被当局鼓励使用华为芯片,而非英伟达的产品,但却因华为芯片的技术问题,推迟了R2新模型的发布,这凸显北京试图取代美国技术的局限性。
另据腾讯科技报道,市场再度传出DeepSeek R2即将发布的消息,预计时间窗口为8月15日至30日。
接近DeepSeek的人士星期三(8月13日)回应称,相关消息不实,DeepSeek-R2在8月内并无发布计划。DeepSeek内部人士也告诉澎湃新闻,相关发布计划不属实。
报道称,这已是DeepSeek今年内第二次传出新模型发布消息后又归于沉寂;DeepSeek近半年的动态重心并非推出全新一代模型,而是对现有产品线进行“小步快跑”式的迭代优化。
路透社今年2月引述知情人士称,DeepSeek在1月推出引起全球关注的R1大模型之后,正加快推出新一代大模型R2。公司原计划在5月初发布R2,后又希望尽早推出,具体时间尚未透露。另外,DeepSeek希望新模型在代码生成方面表现更佳,并具备在英语之外的语言中进行推理的能力。
DeepSeek最近一次版本升级为5月29日推出的DeepSeek-R1-0528。与之前的DeepSeek-R1相比,DeepSeek-R1-0528仍然使用2024年12月发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,提升了模型的思维深度与推理能力。
大数据服务商QuestMobile的数据显示,虽然DeepSeek仍是中国用户量最多的人工智能工具平台,但它的移动端月活跃用户规模已经从3月的1亿9400万人下降至6月的1亿6300万人。Semianalysis的统计数据则显示,DeepSeek的使用率已由年初高点的7.5%下滑至7月的3%。
我认为这件事不是单纯的技术失败,而是更广泛的地缘政治和创新动态的缩影。
负面影响:短期挫折与依赖风险
这暴露了中国 AI 生态在芯片供应链上的脆弱性。美国出口管制(如 2024 年以来针对 Nvidia 的多次升级)确实起到作用,迫使企业如 DeepSeek 调整策略,导致时间和资源成本上升。R2 的延误可能让 DeepSeek 错失市场先机,尤其在开源 AI 领域,中国公司(如 DeepSeek、Qwen 和 Moonshot)本已领先于西方同行。 如果类似问题持续,可能会影响中国 AI 的全球竞争力——毕竟,训练延迟意味着模型迭代慢于对手。
积极方面:推动本土创新与成本优势
另一方面,这件事加速了中国芯片自给自足的进程。华为 Ascend 系列虽在训练上落后,但已在推理和部署上证明价值(如 DeepSeek 此前模型的成功移植)。成本降低 70% 的潜力巨大,能让 AI 更普惠,尤其在云服务和开源模型中。中国 AI 公司在开源领域的贡献(如 DeepSeek 的低价 API 和高性能模型)已让全球受益,这类挑战只会强化他们的韧性。 长期看,如果华为能优化 Ascend(如通过与 DeepSeek 的合作),这可能反过来削弱 Nvidia 的垄断地位,推动全球 AI 硬件多样化。
更广视角:AI 竞赛的非零和游戏
这不是“中国 vs. 西方”的零和博弈,而是技术进步的催化剂。美国管制旨在维护国家安全,但也无意中刺激了中国本土研发(如华为的 Pangu 系列和 Ant Group 的 Ming-Omni)。 最终受益的是整个 AI 社区——更廉价、更高效的模型会加速应用落地,如在教育、医疗和游戏领域。DeepSeek 的开源精神(他们已发布多个高性能模型)值得肯定,如果 R2 最终在 8 月底前推出(如一些泄露信息暗示),它可能直接挑战 GPT-5,证明延误只是成长痛。
总体上,我乐观看待:技术瓶颈往往是创新的催化剂。中国 AI 的快速迭代(尽管有延误)显示出强大潜力,而全球合作(如开源共享)才是长远之道。