电子3月周报:GTC2024引领哪些硬件新方向?
2024年03月25日 国联证券 熊军
英伟达推出Blackwell平台
3月19日凌晨,英伟达CEO黄仁勋在GTC大会上推出了新一代算力产品,包括Blackwell架构、Blackwell GPU、GB200超级芯片组和DGX GB200系列服务器等。与上代产品H100相比,GB200在算力、能耗和成本方面都有了很大的提升。此次GTC大会,黄仁勋强调了Blackwell平台的重要性,英伟达产品的重心也从过去提供芯片(GPU)向提供机柜(DGX系列)、AI数据中心转变。
Blackwell GPU:双芯片设计,C2C实现连接
Blackwell GPU采用台积电定制的4NP制程工艺,拥有2080亿个晶体管,比H100多1280亿个晶体管。Blackwell GPU采用双芯片设计,将两颗Blackwell架构的GPU die通过NVLink-C2C连接合封成一颗GPU。BlackwellGPU采用的C2C是多芯片封装工艺(MCM),与直接做成一颗大die相比,两颗小die的良率、设计成本及制造成本上更有优势。过去先进封装主要应用在异构芯片上,英伟达将2颗相同die合封有望引领封装进入新的应用场景。
NVlink Switch:背板铜缆连接,成本效益显著
英伟达通过设计NVLink Switch芯片构建了DGX GB200NVL72系统,实现了GPU之间的高速通信,就可以将DGX视为一个很大的GPU系统。NVLinkSwitch芯片采用台积电4NP制造工艺,拥有500亿个晶体管,同时拥有4个带宽为1.8TB/s的NVLink。NVLink Switch采用铜连接技术,成本效益显著。使用光连接驱动NVLink主干需要耗电2万瓦,而NVLink Switch无需耗电就可以做到。此外,采用线缆背板架构能有效解决传统主板架构无法容纳众多GPU或CPU的问题。
DGX SuperPOD:高效液冷机架,助力机柜散热
英伟达推出了下一代AI超级计算机——由NVIDIA GB200Grace Blackwell超级芯片提供支持的NVIDIA DGX SuperPOD,用于处理万亿参数模型,并具有持续的正常运行时间,以实现超大规模生成式AI训练和推理工作负载。新型DGX SuperPOD采用新型高效液冷机架规模架构,采用NVIDIA DGXGB200系统构建。与风冷技术相比,液冷的优势在于散热效率高、温度控制稳定且能耗低,冷板式液冷和浸没式液冷是行业目前的两条主流技术路线。
投资建议:新硬件新机遇
英伟达是全球AI龙头,其GPU技术将持续引领市场,Blackwell平台带来的新硬件有望成为行业标杆,关注新硬件带来的增量市场机遇:(1)AI芯片的制造离开不开先进工艺,先进制造及封装相关标的:中芯国际、中微公司、芯源微、华海诚科等。(2)HBM供给紧缺,相关标的:雅克科技、中微公司、华海诚科等。(3)重视铜连接、液冷产业链。
风险提示:GB200量产、发售不及预期;HBM、CoWoS供给不及预期。