现在的美股走势有点意思,市值前三把交椅似乎又要轮转,目前是英伟达,苹果,谷歌。随着谷歌新发布的Gemini 3好评如潮,谷歌的投资者似乎期待,短期谷歌的市值超越苹果,直追英伟达。
英伟达的逆风
随着,美联储12月降息预期清晰,这几天的科技股走势,出现了分化,谷歌股价在巴菲特和Meta的数十亿美元订单的传闻下,上涨强势,而英伟达却因为涉嫌「会计欺诈」,一位独立研究员指控称,「检测到6100亿美元欺诈」而股价连连挫败。
财经媒体The Information的独家消息:Meta Platforms(Facebook和Instagram的母公司)正在与Google进行谈判,计划斥资数十亿美元购买Google的TPU(Tensor Processing Units)芯片。
英伟达在GTC大会之后,市值一度破了5万亿美元。当然随后,市场获利回吐,股价的崩跌,让市场做空和质疑的消息越来越猛烈,人们开始传英伟达付款收集和现金生成远低于行业规范,暗示可能存在循环融资或“庞氏方案”,即通过关联交易伪造收入。 如有人指出英伟达通过投资CoreWeave等云提供商,然后租回自家芯片来循环资金,涉嫌提前确认未来收入。还有传闻称英伟达交付大量故障GPU,导致订单取消,并通过“mark-to-market”会计方法将未来需求提前计入当前收入,掩盖需求真实情况。 还有指控英伟达在RTX5080性能上撒谎,以及在中国业务上的虚假陈述。
这些传闻,迅速在社交媒体和财经圈传播,引发投资者担忧,导致英伟达股价一度波动。周二(昨日),英伟达股价盘中一度跌超7%,创7个月来最大单日跌幅,总市值较历史最高点蒸发1万亿美元。
TPU vs. GPU
然而,最新的一个对英伟达股价的冲击事件是,谷歌的 Gemini 3 的发布,Gemini 3 的好评如潮,让投资者担心谷歌的全栈 AI 策略(结合 Gemini 模型和 TPU)会侵蚀英伟达的市场份额。
Gemini 3 是其谷歌新一代 AI 模型,据报道在速度和准确性上超越竞争对手,而且,它的部署以及训练,推理完全是在谷歌自家 TPU(Tensor Processing Unit)基础设施上。 这标志着谷歌在 AI 硬件领域的垂直整合策略,即从模型开发到芯片设计的闭环控制。这种方法直接挑战英伟达的 GPU 霸主地位,因为 TPU 被视为 AI 专用芯片(ASIC)的领导者,在某些指标上可能与英伟达 GPU 平起平坐甚至更优。

Gemini 3 pro 的智商测试在130 ,排名第一
首先,TPU 在性能/瓦特比上领先英伟达 GPU 2-3 倍,甚至有前谷歌云工程师称 TPU v6 的效率高达 60-65%。这使得 TPU 更具成本效益,尤其在 AI 推理时代,谷歌云提供的 TPU 服务成为英伟达 GPU 的可行替代品,后者往往价格高昂且供应紧张。 Gemini 3 的成功部署展示了 TPU 在大规模 AI 任务中的实用性,可能促使更多企业转向谷歌云,减少对英伟达硬件的依赖。
虽说,TPU 目前主要用于谷歌内部和云服务,但是他们已经或者正在向外部伙伴销售,如Anthropic部署百万级TPU而非NVIDIA GPU,Meta据传也在洽谈。这一趋势扩大到其他巨头,如亚马逊的Trainium和微软的Maia,旨在降低对NVIDIA的依赖。
目前,Gemini 3 的强势很明显。其推理能力超越 ChatGPT、Grok 等模型,支持多模态(文字、图片、影片),可能成为用户首选,取代其他 AI 工具。而Gemini 3 基于谷歌 的TPU 优势在于成本效益高(CP 值佳),可降低运算成本,提高获利。
当然,英伟达是通用型芯片,打个比方,TPU像“定制刀具”仅适配矩阵运算等AI核心任务,对动态模型、定制算子等场景支持较差,而GPU如同“瑞士军刀”,能应对图形处理、科学计算等多类需求,总之TPU的通用性和灵活性不如 GPU。
另一方面,英伟达的核心护城河 CUDA已经历经20年了,是一个成熟的软件生态,支持 PyTorch、TensorFlow 和 JAX 等主流框架,开发者社区庞大(CUDA生态服务全球400万开发者)。CUDA 中有各类的模型,集成工具也多(如 cuDNN、cuBLAS)且工具适配成熟,在大学课程、在线教程和企业项目中广泛普及,兼容性强,开发者能轻松迁移代码,这使得 GPU 在通用 AI 任务中更灵活。
虽然,TPU的成本效益高,但是,企业换用TPU需改造代码、培训人才,试错成本太高了。如今,90%的 AI 项目已经锁定在英伟达的软件栈中,迁移到 TPU 需要重写代码,几乎不可能。
推动TPU的生态难度极高,如谷歌的一个编译器框架,XLA,用于将高层次代码转换为高效的机器代码,但使用的时候,需要理解底层优化细节,如手动调整计算图、处理特定硬件加速等。这对初学者来说太复杂,因为它不像通用工具那样“开箱即用。
谷歌维护的JAX 库,虽然强大但抽象,需要用户熟悉函数式编程、JIT(Just-In-Time)编译等概念,初学者上手太难,,可能需要重写代码或学习新范式。也就是说,谷歌的TPU的生态较小众,学习和掌握这项技术需要投入更多时间、精力和技术门槛更高。相比,CUDA 的学习曲线更平缓,因为网上有海量教程、示例和兼容性。
总之,从生态系统的完整度、用户基数、工具链的丰富度和标准化程度以及软件整合上,英伟达的CUDA 有绝对的竞争优势。
如果谷歌的全栈策略(如 Gemini + TPU)将来进一步开放和普及,如提供更多的兼容工具,吸引更多开发者,的确会削弱CUDA 的垄断地位,但是,这需要很长的时间。
英伟达的回应

这几天,谷歌持续强势上攻,而英伟达还留在估值泡沫的舆论风暴中盘整,而“大空头”迈克博瑞还在“AI泡沫”论战中,称“英伟达就是当年的思科”。
昨日,英伟达盘中重挫了7%,而谷歌又再创新高。
英伟达大跌后罕见安抚市场,我司GPU比谷歌AI芯片领先一代。
我们对谷歌的成功感到非常高兴,他们在AI领域取得了巨大进步,我们将继续为其提供产品和服务。英伟达领先业界一代,它是唯一能够运行所有人工智能模型并应用于所有计算场景的平台。与专为特定AI框架或功能设计的ASIC相比,NVIDIA提供了更高的性能、多功能性和可互换性。



