这款新型3D芯片有望解决AI的最大难题
作者: aeks | 发布时间: 2025-12-24 18:04 | 更新时间: 2025-12-24 18:04
学科分类: 信息与通信工程 电子科学与技术 计算机科学与技术 集成电路科学与工程
与如今大多扁平的2D芯片不同,这款3D原型芯片通过向上堆叠而成。超薄部件如同高楼楼层般堆叠,垂直布线则像多部高速电梯,能快速传输海量数据。凭借创纪录数量的垂直连接及将存储与计算单元紧密排布的紧凑布局,该设计避免了限制平面芯片发展的性能瓶颈。在硬件测试和模拟中,其性能比2D芯片高出约一个数量级。此前学术实验室虽研制过实验性3D芯片,但这是首次实现显著性能提升并在商业代工厂生产的3D芯片。斯坦福大学Subhasish Mitra教授表示:“这为芯片生产和创新开启了新纪元,此类突破将帮助我们实现未来AI系统所需的千倍硬件性能提升。”
为何平面芯片难以应对现代AI?以ChatGPT、Claude为代表的大型AI模型需不断在存储器(存储信息)和计算单元(处理信息)间传输海量数据。传统2D芯片所有部件位于同一表面,存储器容量有限且分布分散,数据被迫通过少量冗长、拥挤的路径传输。计算部件运行速度远超数据传输速度,且附近存储器不足,导致频繁等待,即工程师所说的“存储墙”——处理速度超过芯片数据供给能力。多年来,芯片制造商通过缩小晶体管(处理计算和存储数据的微小开关)并增加芯片上的晶体管数量来突破存储墙,但这种方法正接近物理极限“微型化墙”。
新设计通过向上堆叠突破这两个极限。卡内基梅隆大学Tathagata Srimani助理教授解释:“垂直整合存储与计算能更快传输更多信息,就像高楼电梯群让众多住户同时往返楼层。”宾夕法尼亚大学Robert M. Radway助理教授补充:“我们通过紧密整合存储与逻辑并以极高密度向上堆叠攻克难题,如同计算领域的曼哈顿——小空间内容纳更多‘人口’。”
单片3D芯片的制造方式不同于早期3D芯片堆叠独立芯片的简单方法。该团队采用“单片”3D集成:在单一连续流程中直接在已有层上构建新层,低温工艺避免损坏下方电路,使层间排布更紧密、连接密度更高。关键是整个流程在国内商业代工厂完成,SkyWater Technology的Mark Nelson指出:“这表明先进架构能在国内规模化生产,是美国保持半导体创新前沿所需。”
性能方面,早期测试显示原型性能比同类2D芯片高约4倍,模拟显示堆叠更多层后,在真实AI工作负载(含基于Meta开源LLaMA模型的负载)上性能可提升12倍,还能使能量延迟积(EDP,结合速度和能效的指标)提升100 - 1000倍。其重要性不仅在于速度,更在于证明单片3D芯片可在美国制造,为本土设计制造先进芯片提供蓝图,还需培养掌握该技术的新一代工程师。斯坦福大学H.-S. Philip Wong教授表示:“此类突破关乎性能,更关乎能力——制造先进3D芯片能让我们更快创新、响应,塑造AI硬件未来。”
该研究由斯坦福大学、卡内基梅隆大学、宾夕法尼亚大学、麻省理工学院合作完成,所有制造在SkyWater Technology明尼苏达州布卢明顿代工厂进行,获美国国防高级研究计划局、国家科学基金会等机构支持。