人工智能的热潮正在遭遇一个意想不到的对手:自己的供应链。硅谷的程序员们最近迷上了一种新游戏——“代币内卷”,比拼谁消耗的文本片段更多。今年1月到3月,OpenRouter平台每周处理的代币量翻了两番。但需求的疯狂增长,已经让整个硬件支撑体系开始出现裂缝。
3月份,Anthropic在高峰时段限制用户访问其工具,随后调整了订阅计划以控制使用量。到了4月,这家备受企业客户青睐的AI实验室平均每天中断约30分钟。竞争对手OpenAI更干脆,直接关掉了刚推出的视频生成工具Sora,把稀缺的计算资源挪到了赚钱的业务上。4月20日,微软旗下的GitHub也停掉了其编程机器人的新订阅。这些现象指向一个共同的问题:算力不够了。
巨头们正在用钱砸出一条路。Anthropic与亚马逊达成1000亿美元合作,以获得高达5吉瓦的服务器算力;谷歌也承诺投资400亿美元。所谓的五大超大规模科技公司——Alphabet、亚马逊、Meta、微软和甲骨文——每家都在数据中心上投入数千亿美元。今年仅Alphabet、亚马逊和甲骨文三家的债务融资就超过1000亿美元。为了回笼资金,Meta宣布裁员10%,微软也向约7%的员工提供了自愿离职方案。
.png)
然而,钱并不总能解决问题。政治阻力正在上升。4月,缅因州议员投票支持禁止建设大型数据中心的法案,尽管被州长否决,但美国十几个州的议员都在审议类似措施。去年美国价值1560亿美元的数据中心项目因反对和诉讼被搁置。从爱尔兰到巴西,反对声音也越来越大。人们担心这些耗电巨兽会推高电费,而海湾战争推高的能源价格只会让这种担忧更强烈。
即便数据中心获批并接上了电——无论是电网还是自备发电设备——它们也很难买到运营所需的设备。研究机构SemiAnalysis指出,新建数据中心所需的芯片供不应求。英伟达2022年推出的H100 GPU,租赁价格自去年11月以来已飙升约30%,因为客户买不到新款只好抢旧款。亚马逊的Trainium2 AI芯片算力资源几近售罄,明年推出的Trainium4大部分产能“已被预订”。
存储芯片同样紧缺,SK海力士、三星和美光均表示2026年的大部分高带宽内存供应已售罄。谷歌3月发布的TurboQuant算法曾一度给市场带来希望——它能减少AI所需的内存量,导致存储芯片股价大跌——但即便如此,高带宽内存的供应缺口预计至少还要持续三年。
短缺正在蔓延到中央处理器。投资银行摩根士丹利估算,智能体系统每配备一个图形处理器就需要一个CPU,而聊天机器人系统的比例是12:1。对CPU的旺盛需求,意外地给英特尔注入了生机——这家一度濒临破产的芯片制造商,市值在过去六个月翻了一倍多。
问题的根源并不复杂:硬件制造商的投资意愿和速度,远远跟不上超大规模云服务商的胃口。我们对约50家最大的芯片、设备、服务器、网络和冷却制造商进行测算后发现,自2024年以来,五家超大规模云服务商的资本支出总额增长了190%,从2340亿美元增至6770亿美元;而它们的硬件供应商,资本支出仅增长了45%,从1530亿美元增至2230亿美元。
以台积电为例,其最先进的晶圆厂已经满负荷运转。总裁魏哲家承认芯片供应“非常紧张”,但“没有捷径可走”——新建一座晶圆厂需要两到三年。台积电计划2026年投入约550亿美元,但从营收占比看,其资本支出已从2022年约一半降至今年的三分之一。
这样的谨慎让客户们急得跳脚。OpenAI的奥特曼敦促台积电“赶紧扩大产能”。马斯克则宣布要建一座“超级工厂”,目标是每年生产出超过如今全球半导体行业总和的处理能力。他请来了英特尔协助,但这座工厂最早也要2028年才可能投产,而且规模远低于最初设想。更关键的是,连制造芯片的设备本身也处于短缺状态。
在我看来,这场供应链危机揭示了一个更深层的结构性问题:AI行业的创新周期是以月为单位计算的,而硬件产能的扩张周期是以年为单位计算的。两者之间的时间差,正在被市场过度乐观的需求预期不断放大。
硬件厂商经历过前几轮周期的产能过剩噩梦,本能地选择保守,而云服务商为了争夺AI时代的门票,不计成本地投入。这种错配不会很快消失,它意味着未来两年算力仍将是稀缺资源。那些过度依赖“烧代币”来展示AI能力的商业模式,或许会比预期更早感受到寒意。



