7月1日,SemiAnalysis创始人Dylan Patel在红杉资本播客《Training Data》中抛出了一系列足以颠覆行业认知的判断。这家以芯片级拆解和卫星图像追踪数据中心而闻名的研究机构,其创始人的观点从来不是空泛的预言,而是建立在硬数据之上的推演。
第一个判断,也是最具冲击力的一个:AI推理将成为全球最大市场之一,规模可能超过石油,占全球GDP多个百分点。
石油是全球经济的血液,年市场规模约2万亿美元。Patel认为AI推理将超越这个数字。支撑这个判断的逻辑不是乐观情绪,而是数学:模型每次迭代升级后,可完成任务的数量和价值扩张速度持续快于算力增长 。任务在膨胀,价值在膨胀,而算力供给跟不上——这意味着算力短缺不是短周期现象,而是AI产业的长期结构性特征。
到2030年,仅OpenAI和Anthropic两家公司的合计算力需求就将超过100吉瓦。 100吉瓦是什么概念?相当于100座核电站的装机容量。这还只是两家公司。如果算上Meta、Google、微软等巨头,数字将更为惊人。
算力永远不够用,这是Patel给出的第一个底层判断。

第二个判断:硬件软件协同设计才是真正的百倍效率提升来源,而不是更快的芯片。
过去三年,AI效率的提升主要来自模型层和跨层协同优化,而非硬件本身的进步。从Hopper到Blackwell,在最优化部署下效能提升约30倍,但过去三年整体每瓦智能的提升远超出硬件的单一贡献。
Patel把这一过程描述为"token工厂":GPU、网络设备、内存系统、电力基础设施和软件栈协同工作,生成用于AI推理和训练的token。 真正的效率来自整个系统的协同,而不是某一个部件的提速。
这引出了第三个判断——也是最容易被误解的一个:CUDA的护城河,本质上不是CUDA本身,而是开源模型生态普遍围绕GPU协同优化。
Patel用了一个极具说服力的例子:DeepSeek的专家模型形状专门为英伟达Hopper架构优化,在Hopper上表现出色,但在TPU上表现不佳。 Anthropic的模型更稠密,更适合TPU路线;OpenAI的模型则偏向GPU路线。
这不是兼容性问题,这是生态绑定的问题。DeepSeek的模型是为Hopper写的,不是在TPU上跑的——两者的区别,就是"能用"和"好用"之间的全部差距。 CUDA的护城河已经从编程语言本身,转向了开源模型生态与硬件架构的深度绑定。
Patel团队搭建的实时推理基准系统InferenceX提供了一个量化视角:在等效质量下,推理成本每年下降约60倍,每瓦智能改善约40倍。 成本在暴跌,效率在飙升,但需求增长得更快——这就是算力永远不够用的根本原因。
第四个判断,关于黄仁勋的真正战略:扶持新兴云商,不是为了做慈善,是为了防止算力被垄断。
Patel的原话是:"Jensen非常厌恶一种世界格局:超大规模云厂商垄断一切。"英伟达正在积极支持CoreWeave、Crusoe等新兴云商,塑造多极化算力格局,削弱Google TPU和Amazon Trainium等自研芯片的长期替代压力。
如果算力被三家超大规模云商垄断,它们就有足够的议价权来压英伟达的价格、推自己的芯片。但如果有一批新兴云商站起来,英伟达就有了多重出海口。这不是在扶持竞争对手,这是在制造自己的战略缓冲区。
第五个判断,时间跨度最长的一个:未来3到5年,太空数据中心的影响可忽略不计;但到2040年,超过一半的新增算力可能部署在太空。
Patel给出的核心制约因素是地面能源成本和建电能力。地面数据中心的扩张正在撞上物理极限——土地、电力、冷却、监管,每一样都在收紧。一旦太空部署的经济性超过地面,算力向太空迁移将成为必然。
SemiAnalysis此前的测算显示,在基础情境下,太空与地面数据中心的计算平准化成本可能要到2040年才达到平价。到2030年代初,太空数据中心成本可能仍比地面高约30%。 30%的溢价换来的是在轨太阳能、自然冷却和无限的土地——这笔账在2040年可能会变得非常划算。
把Patel的五个判断拼在一起,一幅完整的图景浮现出来。
AI推理正在成为人类历史上最大的单一市场,规模超过石油,占全球GDP多个百分点。算力永远不够用,因为需求扩张的速度永远快于供给增长的速度。真正的效率提升来自硬件软件协同设计,而不是单纯的芯片迭代。CUDA的护城河已经变成生态绑定,模型为特定架构深度优化,迁移成本高到无法承受。黄仁勋扶持新云商是为了防止算力垄断,这是一盘长达十年的战略棋局。太空数据中心在2040年将承载过半新增算力,因为地面已经装不下了。
这些判断的共同特征是:它们都是结构性的,不是周期性的。算力短缺不是暂时的供需错配,是AI任务膨胀速度持续跑赢算力增长速度的必然结果。CUDA的护城河不是软件本身,是十几年积累的生态惯性。太空算力的迁移不是科幻,是地面物理极限倒逼的结果。
Patel描绘的不是一个AI产业的短期图景,而是一个二十年尺度的结构性重构。 在这个图景里,推理取代石油成为最大的市场,算力取代能源成为最稀缺的资源,协同设计取代芯片制程成为效率提升的核心来源,太空取代地面成为算力的最终归宿。
对于投资者而言,这些判断指向几个清晰的结论。算力基础设施的资本开支周期远比市场预期的更长,因为需求永远跑在供给前面。硬件软件协同设计能力正在成为比芯片制程更关键的竞争维度。CUDA生态的护城河比大多数人想象的更深,因为它已经渗透到了模型架构层面。英伟达扶持新云商的战略不是短期营销,是防止客户自研芯片替代自己的长期布局。太空数据中心的投资窗口在2030年代初期打开,在2040年代全面爆发。
Patel用两个多小时的播客,画了一张2040年的AI产业地图。这张地图上最大的确定性和最大的不确定性指向同一个方向:算力永远不够用,所以谁掌握了算力的供给,谁就掌握了下一个时代的经济命脉。



