开云彩票Gaudi 3对比NVIDIA H100-开云彩票(中国)官方网站
发布日期:2024-10-02 13:41 点击次数:94早在4月份,Intel就通知了新一代AI加快器Gaudi 3,当今它终于发布了,属目标规格参数也已出炉,竞争敌手直指NVIDIA H100 GPU加快器,天然后者的Blackwell系列也要上量了。
Gaudi 3的规格擢升幅度号称进步式的,制造工艺从台积电7nm来到台积电5nm,MME(矩阵乘法引擎)从2个加多到8个,天然每个MME里面的TPC(张量惩办中枢)从12个减少到8个,然则总额从24个大幅加多到了64个,另外媒体解码器差从8个增至14个。
内置SRAM缓存容量翻番至96MB,带宽翻倍至12.8TB/s。
中枢地能方面,MME BF16/FP8王人是1835 TFlops(每秒1.835亿亿次),矢量BF16则是28.8 TFlops(每秒28.8万亿次),分裂擢升了3.2倍、1.1倍、1.6倍。
HBM2E高带宽内存容量从96GB加多到128GB(八颗),带宽也得当加多来到惊东说念主的3.7TB/s。
24个200Gb RDMA收集接口,双向收集互连带宽1.2TB/s,主机接口峰值双向带宽128GB/s,系统总线升级为PCIe 5.0 x16。
按照官方说法,Gaudi 3对比NVIDIA H100,LLM大模子推感性能发轫50%、磨砺时候快40%,性价比则是敌手的2倍。
诞生方面,无缝兼容PyTorch框架、Hugging Face Transformer和扩散模子。
Gaudi 3加快器提供三种部署款式,一是OAM 2.0法式夹层卡,被迫散热峰值功耗900W,液冷散热峰值功耗1200W,扶持48个112Gb PAM4SerDes收集连络。
二是HLB-325通用基板,扶持八颗Gaudi 3,具体功耗未知道。
三是HL-338彭胀卡,PCIe 5.0 x16接口,被迫散热峰值功耗600W,还不错四卡互连。
Intel此前已通知,IBM将会在其云就业中部署Gaudi 3加快器。
另有音讯称,Gaudi 3加快器也有中国特供版,其中OAM模组、PCIe模组的峰值功耗王人划定至450W,算力天然也会大打扣头,但暂无更进一步说法。