中国的初创公司DeepSeek以低成本、高性能的AI模型震撼了全球科技界,挑战了美国科技巨头的霸主地位。
这家名不见经传的杭州企业,凭借其R1模型和后续升级版本,不仅在性能上与OpenAI的ChatGPT比肩,还以极低的开发成本颠覆了行业对AI研发的传统认知。这股浪潮推动了开源AI的热潮,迫使美国公司重新审视战略,同时也引发了关于技术竞争、数据安全和全球AI格局的激烈争论。
DeepSeek的崛起始于2025年1月,其R1模型一经发布便席卷市场。这个基于DeepSeek-V3的模型,拥有6710亿个参数和12.8万的上下文长度,能处理复杂推理任务,如数学、编程和逻辑问题,性能直逼OpenAI的o1模型。
更令人震惊的是,DeepSeek宣称其开发成本仅为数百万美元,远低于美国公司动辄数十亿的投入,且使用了不到2000个Nvidia芯片,相比之下,行业巨头通常需要1.6万个芯片的超级计算机。1月20日,DeepSeek的免费聊天机器人应用一夜之间登顶苹果应用商店,超越ChatGPT,引发了市场震动。
这场风暴的核心在于开源模型的颠覆性潜力。DeepSeek将其模型免费开放,允许开发者自由复制和改进,这与美国公司如OpenAI的闭源模式形成鲜明对比。开源的优势显而易见:它降低了进入门槛,让中小型企业和开发者能够以低成本构建AI应用。
2025年,全球有超过5000家初创公司采用DeepSeek的模型,覆盖金融、医疗和教育等领域。相比之下,OpenAI的API许可费用高昂,许多现金流紧张的公司转而选择DeepSeek以节省成本。
硅谷一位投资者透露,部分初创公司通过使用DeepSeek模型,将AI开发成本削减了70%,这些节省的资金被用于招聘和市场扩张。
面对这一挑战,美国科技巨头迅速做出反应。OpenAI在8月5日发布了其六年来的首个开源模型——GPT-oss-120b和GPT-oss-20b,可在Hugging Face平台免费使用。这两款模型专注于文本生成和复杂任务处理,如代码编写和在线信息检索,直接回应DeepSeek的竞争压力。
Meta则进一步加码,其创始人马克·扎克伯格长期倡导开源战略,认为这有助于美国在AI竞争中保持领先。2025年,Meta的Llama模型升级,吸引了更多开发者,但DeepSeek的低成本优势仍让其感受到压力。特朗普政府也加入了这场争论,呼吁更多美国公司拥抱开源,以对抗中国的技术崛起。
2025年4月,DeepSeek与清华大学合作发布了一篇论文,提出了一种新型强化学习方法,大幅降低模型训练成本。这一进展引发了行业震动,硅谷初创公司d-Matrix的CEO Sid Sheth表示,DeepSeek让人们意识到“更大不一定更好”。与此同时,美国公司面临估值压力,投资者开始质疑高昂的AI基础设施投资是否物有所值。
DeepSeek的成功可能让AI技术商品化,类似智能手机行业的竞争格局,未来多家公司可能提供性能相近的产品。2025年5月,DeepSeek发布R1-0528升级版,支持系统提示和JSON输出,减少了幻觉率,进一步巩固了其竞争力。欧盟和美国的企业开始探索本地运行DeepSeek模型,以规避数据隐私风险。
无论结果如何,DeepSeek已点燃了一场全球AI革命的火花。