上证指数 3876.34 0.38%
|
深证成指 13215.46 1.16%
|
恒生指数 26908.39 1.78%
|
纳斯达克 22211.98 -0.55%
|
日经225指数 44790.38 -0.25%
|
Vicky 初级编辑
234 文章
324006 阅读
首页  >  要闻 >  综述 >  正文
申请成为签约作者 >
Deepseek和开源模型们 如何撼动人工智能?
2025年08月22日 04:48    
收藏  
举报

中国的初创公司DeepSeek以低成本、高性能的AI模型震撼了全球科技界,挑战了美国科技巨头的霸主地位。

这家名不见经传的杭州企业,凭借其R1模型和后续升级版本,不仅在性能上与OpenAI的ChatGPT比肩,还以极低的开发成本颠覆了行业对AI研发的传统认知。这股浪潮推动了开源AI的热潮,迫使美国公司重新审视战略,同时也引发了关于技术竞争、数据安全和全球AI格局的激烈争论。

DeepSeek的崛起始于2025年1月,其R1模型一经发布便席卷市场。这个基于DeepSeek-V3的模型,拥有6710亿个参数和12.8万的上下文长度,能处理复杂推理任务,如数学、编程和逻辑问题,性能直逼OpenAI的o1模型。

更令人震惊的是,DeepSeek宣称其开发成本仅为数百万美元,远低于美国公司动辄数十亿的投入,且使用了不到2000个Nvidia芯片,相比之下,行业巨头通常需要1.6万个芯片的超级计算机。1月20日,DeepSeek的免费聊天机器人应用一夜之间登顶苹果应用商店,超越ChatGPT,引发了市场震动。

这场风暴的核心在于开源模型的颠覆性潜力。DeepSeek将其模型免费开放,允许开发者自由复制和改进,这与美国公司如OpenAI的闭源模式形成鲜明对比。开源的优势显而易见:它降低了进入门槛,让中小型企业和开发者能够以低成本构建AI应用。

2025年,全球有超过5000家初创公司采用DeepSeek的模型,覆盖金融、医疗和教育等领域。相比之下,OpenAI的API许可费用高昂,许多现金流紧张的公司转而选择DeepSeek以节省成本。

硅谷一位投资者透露,部分初创公司通过使用DeepSeek模型,将AI开发成本削减了70%,这些节省的资金被用于招聘和市场扩张。

面对这一挑战,美国科技巨头迅速做出反应。OpenAI在8月5日发布了其六年来的首个开源模型——GPT-oss-120b和GPT-oss-20b,可在Hugging Face平台免费使用。这两款模型专注于文本生成和复杂任务处理,如代码编写和在线信息检索,直接回应DeepSeek的竞争压力。

Meta则进一步加码,其创始人马克·扎克伯格长期倡导开源战略,认为这有助于美国在AI竞争中保持领先。2025年,Meta的Llama模型升级,吸引了更多开发者,但DeepSeek的低成本优势仍让其感受到压力。特朗普政府也加入了这场争论,呼吁更多美国公司拥抱开源,以对抗中国的技术崛起。

2025年4月,DeepSeek与清华大学合作发布了一篇论文,提出了一种新型强化学习方法,大幅降低模型训练成本。这一进展引发了行业震动,硅谷初创公司d-Matrix的CEO Sid Sheth表示,DeepSeek让人们意识到“更大不一定更好”。与此同时,美国公司面临估值压力,投资者开始质疑高昂的AI基础设施投资是否物有所值。

DeepSeek的成功可能让AI技术商品化,类似智能手机行业的竞争格局,未来多家公司可能提供性能相近的产品。2025年5月,DeepSeek发布R1-0528升级版,支持系统提示和JSON输出,减少了幻觉率,进一步巩固了其竞争力。欧盟和美国的企业开始探索本地运行DeepSeek模型,以规避数据隐私风险。

无论结果如何,DeepSeek已点燃了一场全球AI革命的火花。

声明: 本文由入驻币海编者上传,观点仅代表编者本人,不代表币海财经赞同其观点或证实其描述,请自行判断。
延伸阅读
通胀分化难阻降息预期!美股齐创新高 中概大反弹
   币海独步者        2025/09/12 01:24
算力即权力?甲骨文联手OpenAI暴涨40%背后的隐秘逻辑
   林天心        2025/09/11 02:53
马斯克:我想知道什么是真实的,即使答案是完全消灭我的意识
   鲁克        2025/09/08 11:47
马来西亚推出首个人工智能银行Ryt Bank:金融科技的新篇章
   Vicky        2025/08/29 08:41
资本热捧下的中国生物科技:创新加速与全球突围
   流动的沙        2025/08/28 05:22
为什么Palantir 是世界上最重要的科技公司?
   鲁克        2025/08/06 21:46