12月11日消息,美国近期解除了NVIDIA H200显卡对华出口的限制。相较于此前推出的“阉割版”H200,这款显卡在性能上有显著提升,对于增强大模型的训练与推理能力具有积极作用。
在H200解禁的同时,还有一个问题值得留意,即这款显卡所采用的HBM3e显存是否也一同解禁了。遗憾的是,答案是否定的——美国针对国内企业的HBM出口禁令依旧生效,并且不允许单独售卖该显存。
NVIDIA的H200显卡采用了上一代的Hopper架构,其FP32性能为67TFLOPS,FP16性能更是达到了1979TFLOPS,这一性能是H20显卡的6倍。此外,H200显卡还是全球首款搭载HBM3e显存的产品,显存容量为141GB,带宽高达4.8TB/s。
国内此前使用的AI显卡采用的仍是HBM2e标准,无论是在容量还是性能方面,都已无法满足顶级AI模型的需求。
尽管HBM3e依旧无法出口,但华为已推出自研的替代方案。今年9月,华为宣布自主研发了HiBL 1.0和HiZQ 2.0两款HBM产品,这两款产品能够依据不同的应用场景,适配各类AI显卡。
明年上半年推出的Ascend?950PR搭载了华为自主研发的低成本HBM技术HiBL 1.0,相较于高性能但高成本的HBM3e/4e,该技术可显著减少推理Prefill阶段与推荐业务的投入成本。
预计明年下半年推出的Ascend 950DT搭载了HiZQ 2.0技术,这一配置让其内存容量提升至144GB,内存访问带宽也达到了4TB/s的水平。此外,该产品的互联带宽也同步升级到了2TB/s。
未来的Ascend 960与Ascend 970将在2027至2028年间进一步提升性能,其中容量会增加到288GB,带宽分别达到9.6TB/s和14.4TB/s。