Deepseek和开源模型们如何撼动人工智能？_综述

首页 > 要闻 > 综述 > 正文

Deepseek和开源模型们如何撼动人工智能？

2025年08月22日 12:48

中国的初创公司DeepSeek以低成本、高性能的AI模型震撼了全球科技界，挑战了美国科技巨头的霸主地位。

这家名不见经传的杭州企业，凭借其R1模型和后续升级版本，不仅在性能上与OpenAI的ChatGPT比肩，还以极低的开发成本颠覆了行业对AI研发的传统认知。这股浪潮推动了开源AI的热潮，迫使美国公司重新审视战略，同时也引发了关于技术竞争、数据安全和全球AI格局的激烈争论。

DeepSeek的崛起始于2025年1月，其R1模型一经发布便席卷市场。这个基于DeepSeek-V3的模型，拥有6710亿个参数和12.8万的上下文长度，能处理复杂推理任务，如数学、编程和逻辑问题，性能直逼OpenAI的o1模型。

更令人震惊的是，DeepSeek宣称其开发成本仅为数百万美元，远低于美国公司动辄数十亿的投入，且使用了不到2000个Nvidia芯片，相比之下，行业巨头通常需要1.6万个芯片的超级计算机。1月20日，DeepSeek的免费聊天机器人应用一夜之间登顶苹果应用商店，超越ChatGPT，引发了市场震动。

这场风暴的核心在于开源模型的颠覆性潜力。DeepSeek将其模型免费开放，允许开发者自由复制和改进，这与美国公司如OpenAI的闭源模式形成鲜明对比。开源的优势显而易见：它降低了进入门槛，让中小型企业和开发者能够以低成本构建AI应用。

2025年，全球有超过5000家初创公司采用DeepSeek的模型，覆盖金融、医疗和教育等领域。相比之下，OpenAI的API许可费用高昂，许多现金流紧张的公司转而选择DeepSeek以节省成本。

硅谷一位投资者透露，部分初创公司通过使用DeepSeek模型，将AI开发成本削减了70%，这些节省的资金被用于招聘和市场扩张。

面对这一挑战，美国科技巨头迅速做出反应。OpenAI在8月5日发布了其六年来的首个开源模型——GPT-oss-120b和GPT-oss-20b，可在Hugging Face平台免费使用。这两款模型专注于文本生成和复杂任务处理，如代码编写和在线信息检索，直接回应DeepSeek的竞争压力。

Meta则进一步加码，其创始人马克·扎克伯格长期倡导开源战略，认为这有助于美国在AI竞争中保持领先。2025年，Meta的Llama模型升级，吸引了更多开发者，但DeepSeek的低成本优势仍让其感受到压力。特朗普政府也加入了这场争论，呼吁更多美国公司拥抱开源，以对抗中国的技术崛起。

2025年4月，DeepSeek与清华大学合作发布了一篇论文，提出了一种新型强化学习方法，大幅降低模型训练成本。这一进展引发了行业震动，硅谷初创公司d-Matrix的CEO Sid Sheth表示，DeepSeek让人们意识到“更大不一定更好”。与此同时，美国公司面临估值压力，投资者开始质疑高昂的AI基础设施投资是否物有所值。

DeepSeek的成功可能让AI技术商品化，类似智能手机行业的竞争格局，未来多家公司可能提供性能相近的产品。2025年5月，DeepSeek发布R1-0528升级版，支持系统提示和JSON输出，减少了幻觉率，进一步巩固了其竞争力。欧盟和美国的企业开始探索本地运行DeepSeek模型，以规避数据隐私风险。

无论结果如何，DeepSeek已点燃了一场全球AI革命的火花。

声明: 本文由入驻币海编者上传，观点仅代表编者本人，不代表币海财经赞同其观点或证实其描述，请自行判断。