首页 >> 资讯 >

AMD抢先挺进7nmGPU与PCIe4.0发表RadeonInstinctMI60运算加速卡

2022-07-18 17:04:27 来源：用户：

AMD「NextHorizon」活动中，不仅揭晓7nmZen2“ROME”EPYC处理器，更抢先挺进7nm製程GPU与PCIe4.0规格，发表首款RadeonInstinctMI60与MI50运算加速卡。

Vega架构优化7nm製程RadeonInstinctMI60运算加速卡

AMD如期推出Vega架构优化并採用7nm製程的GPU「RadeonInstinctMI60」运算加速卡，新製程与架构优化，让GPU电晶体密度提高2倍，更有着1.25倍的性能提升，以及更高的每瓦效能。

MI60着重于「FP64」与「FP32」加速运算，可加速深度学习所需的Training与Inference运算；以及32GBHBM2记忆体，不仅可达到1TB/s记忆体频宽速度，更具备End-to-EndECC保护。

而MI60除了是首款7nmGPU之外，更是首款支援PCIe4.0的绘图处理器；而多GPU之间通过InfinityFabric桥接，可达到100GB/sperLink的连接频宽，而受惠于PCIe4.0可让GPU与CPU之间达到双向Bi-Directional64GB/s的频宽；更支援硬体层级的GPU虚拟化技术。

性能方面，MI60在一般运算如「双精度矩阵乘法（DGEMM）」比起上一代MI25有着8.8倍的性能提升，达到6.717TFLOPS；而深度学习Resnet-5o的影像辨识速度，MI60可达到每秒498张，更是MI25的2.8倍性能提升。

而且在Resnet-5o深度学习训练上，有着近乎倍数的多GPU性能提升，2GPU有着1.99倍性能提升，8GPU更可保持在7.64倍的训练性能提升。

至于MI60与对手TeslaV100相互比较，双精度矩阵乘法（DGEMM），MI60有着6.717TFLOPS快过V100的6.627TFLOPS；至于单精度矩阵乘法（SGEMM），MI60有着14TFLOPS运算能力，亦赢过V100的13.1TFLOPS；只不过，在Resnet-5o深度学习训练上，MI60仅每秒334张的处理速度，紧追在V100每秒357张的性能之后。

简单来说RadeonInstinctMI60是世界首款7nmGPU产品，以及第一款支援PCIe4.0的运算加速卡，更达到1TB/s记忆体频宽速度，以及硬体层级虚拟化。
针对HPC有着7.4TFLOPSFP64的性能，对于深度学习的Training有着14.7TFLOPSFP32的性能，至于深度学习Inference有着118TOPSINT4的性能表现。

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！