在中美科技角力愈演愈烈的今天,中国正悄悄换了一条赛道——不再死磕更小的芯片制程,而是试图用“堆叠”和“架构创新”来弯道超车。面对美国对先进芯片制造技术的层层封锁,这条路或许成了眼下最现实的选择。
最近,在深圳一场行业会议上,清华大学集成电路学院教授、中国半导体行业协会副会长魏少军抛出一个颇具启发性的观点:哪怕只用14纳米的成熟逻辑芯片,只要搭配高性能内存和一套聪明的计算架构,整体性能也能逼近英伟达基于4纳米工艺打造的GPU。要知道,后者目前几乎是全球AI训练任务的“标配”。
他的方案叫“软件定义近存计算”——听起来很技术,其实核心思想很朴素:让处理器离内存更近一点,减少数据来回搬运的损耗。具体做法是用3D混合键合技术,把14纳米的逻辑芯片和18纳米的DRAM像三明治一样垂直堆在一起。这样一来,不仅性能上去了,功耗和成本反而降下来了。

这种思路,其实早就在华为内部悄然实践。受美国出口管制影响,华为无法大规模生产5纳米甚至更先进的芯片。
但创始人任正非很早就提出,与其在制程上硬刚,不如通过“堆叠和集群”在系统层面实现突破。魏少军的方案,某种程度上正是对这一战略的学术化落地。
更重要的是,他强调这套方案完全依赖“自主可控的供应链”。这话说得轻描淡写,背后却是沉甸甸的现实压力。
自2022年10月起,美国不断收紧对华芯片管制,明确限制14纳米及以下逻辑芯片、18纳米及以下DRAM相关设备和技术的出口。这意味着,即便中国企业有钱,也很难买到通往尖端制造的“门票”。
而更大的隐忧在于生态。全球AI发展至今,几乎被英伟达的GPU和CUDA软件平台牢牢绑定。
魏少军称之为“三重依赖”——从模型训练、硬件架构到开发工具链,整个链条都绕不开英伟达。这种深度耦合,不仅抬高了后来者的门槛,也让中国在AI基础设施上始终处于被动。
正因如此,摆脱对英伟达的依赖已不仅是技术命题,更关乎产业安全。除了堆叠路线,国内企业也在尝试其他路径。比如杭州一家名为中昊新影的初创公司,最近就宣称其自研TPU(张量处理单元)的算力可达英伟达A100 GPU的1.5倍。
虽然这类说法还需市场检验,但它至少说明:中国AI芯片界正在多点开花,不再把鸡蛋放在一个篮子里。
说到底,芯片堆叠未必是终极答案,但在被卡住脖子的当下,它提供了一种务实而巧妙的突围方式——不靠最先进的光刻机,也能拼出接近顶尖的性能。
这条路走得通不通,时间会给出答案。但至少,中国人已经开始用自己的方式重新定义“先进”。



