AMD发布Instinct MI250 MI250X加速卡:6nm双芯、560W功耗
AMD发布Instinct MI250 MI250X加速卡:6nm双芯、560W功耗
除了基于3DV-Cache堆叠缓存的升级版霄龙7003x系列处理器,AMD还为数据中心带来了另一款神器:InstinctMI200系列加速卡(加速器)。
这是AMD的第一款ExaScale百亿亿次级别加速卡产品,号称在同类产品中拥有世界上最快的HPC性能、AI性能。
InstinctMI200系列升级为新的CDNA2计算架构,搭配升级的6nmFinFET工艺,580亿个晶体管,并使用2.5DEFB桥接技术,业内首创多Die整和封装(MCM),内部集成了两颗核心。
还有第三代InfinityFabric总线互连技术,带宽100GB/s,最多8条与第三代霄龙处理器互通,实现CPU/GPU内存一致性。
软件API支持OpenMP、OpenCL、HIP、ROCmOpen、TensorFlow、PyTorch、Kokkos、RAJA。
新系列分为两款型号,InstinctMI250X集成了220个计算单元、14080个流处理器核心,最高频率1.7GHz,并有880个第二代矩阵核心,峰值性能为:FP16半精度383TFlops、FP32单精度/FP64单精度47.9TFlops、FP32单精度/FP64双精度矩阵95.7TFlops、INT4/INT8/BF16383TFlops。
内存/显存搭配8192-bit位宽的128GBHBM2e,频率1.6GHz,峰值带宽3276.8GB/s,并支持全芯片ECC。
整卡采用OAM模块形态(未来也会推出PCIe扩展卡形态),支持PCIe4.0x16,被动散热(系统散热),典型功耗500W,峰值功耗560W。
InstinctMI250精简为208计算单元、13312流处理器核心,各项性能指标也顺应下降约5.5%,其他规格完全不变。
AMD宣称,InstinctMI200系列性能双精度性能比竞品高出最多4.9倍,比上代提升最多4倍。
MI200系列已经赢得了多项客户解决方案,包括ATOSBullSequanaX410-A52U1N2S(双CPU四GPU)、戴尔PowerEdgeR7525(双CPU三GPU)、技嘉G262-Z00(双CPU四GPU)、HPECrayEX235a(单CPU四GPU)等等,其他客户还有话说、联想、KOICmputers等等。
尤其是与美国国防部橡树岭国家实验室、HPE合作打造的超级计算机“Frontier”,采用第三代霄龙处理器、MI250X加速卡,峰值算力高达150亿亿次浮点计算每秒。