首页 >> 资讯 >

AMD抢先挺进7nmGPU与PCIe4.0发表RadeonInstinctMI60运算加速卡

2022-07-18 17:04:27 来源: 用户: 



AMD「NextHorizon」活动中,不仅揭晓7nmZen2“ROME”EPYC处理器,更抢先挺进7nm製程GPU与PCIe4.0规格,发表首款RadeonInstinctMI60与MI50运算加速卡。


Vega架构优化7nm製程RadeonInstinctMI60运算加速卡

AMD如期推出Vega架构优化并採用7nm製程的GPU「RadeonInstinctMI60」运算加速卡,新製程与架构优化,让GPU电晶体密度提高2倍,更有着1.25倍的性能提升,以及更高的每瓦效能。






MI60着重于「FP64」与「FP32」加速运算,可加速深度学习所需的Training与Inference运算;以及32GBHBM2记忆体,不仅可达到1TB/s记忆体频宽速度,更具备End-to-EndECC保护。

而MI60除了是首款7nmGPU之外,更是首款支援PCIe4.0的绘图处理器;而多GPU之间通过InfinityFabric桥接,可达到100GB/sperLink的连接频宽,而受惠于PCIe4.0可让GPU与CPU之间达到双向Bi-Directional64GB/s的频宽;更支援硬体层级的GPU虚拟化技术。










性能方面,MI60在一般运算如「双精度矩阵乘法(DGEMM)」比起上一代MI25有着8.8倍的性能提升,达到6.717TFLOPS;而深度学习Resnet-5o的影像辨识速度,MI60可达到每秒498张,更是MI25的2.8倍性能提升。

而且在Resnet-5o深度学习训练上,有着近乎倍数的多GPU性能提升,2GPU有着1.99倍性能提升,8GPU更可保持在7.64倍的训练性能提升。








至于MI60与对手TeslaV100相互比较,双精度矩阵乘法(DGEMM),MI60有着6.717TFLOPS快过V100的6.627TFLOPS;至于单精度矩阵乘法(SGEMM),MI60有着14TFLOPS运算能力,亦赢过V100的13.1TFLOPS;只不过,在Resnet-5o深度学习训练上,MI60仅每秒334张的处理速度,紧追在V100每秒357张的性能之后。






简单来说RadeonInstinctMI60是世界首款7nmGPU产品,以及第一款支援PCIe4.0的运算加速卡,更达到1TB/s记忆体频宽速度,以及硬体层级虚拟化。
针对HPC有着7.4TFLOPSFP64的性能,对于深度学习的Training有着14.7TFLOPSFP32的性能,至于深度学习Inference有着118TOPSINT4的性能表现。







  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
站长推荐