首页 >> 资讯 >
AMD「NextHorizon」活动中,不仅揭晓7nmZen2“ROME”EPYC处理器,更抢先挺进7nm製程GPU与PCIe4.0规格,发表首款RadeonInstinctMI60与MI50运算加速卡。
Vega架构优化7nm製程RadeonInstinctMI60运算加速卡
AMD如期推出Vega架构优化并採用7nm製程的GPU「RadeonInstinctMI60」运算加速卡,新製程与架构优化,让GPU电晶体密度提高2倍,更有着1.25倍的性能提升,以及更高的每瓦效能。
MI60着重于「FP64」与「FP32」加速运算,可加速深度学习所需的Training与Inference运算;以及32GBHBM2记忆体,不仅可达到1TB/s记忆体频宽速度,更具备End-to-EndECC保护。
而MI60除了是首款7nmGPU之外,更是首款支援PCIe4.0的绘图处理器;而多GPU之间通过InfinityFabric桥接,可达到100GB/sperLink的连接频宽,而受惠于PCIe4.0可让GPU与CPU之间达到双向Bi-Directional64GB/s的频宽;更支援硬体层级的GPU虚拟化技术。
性能方面,MI60在一般运算如「双精度矩阵乘法(DGEMM)」比起上一代MI25有着8.8倍的性能提升,达到6.717TFLOPS;而深度学习Resnet-5o的影像辨识速度,MI60可达到每秒498张,更是MI25的2.8倍性能提升。
而且在Resnet-5o深度学习训练上,有着近乎倍数的多GPU性能提升,2GPU有着1.99倍性能提升,8GPU更可保持在7.64倍的训练性能提升。
至于MI60与对手TeslaV100相互比较,双精度矩阵乘法(DGEMM),MI60有着6.717TFLOPS快过V100的6.627TFLOPS;至于单精度矩阵乘法(SGEMM),MI60有着14TFLOPS运算能力,亦赢过V100的13.1TFLOPS;只不过,在Resnet-5o深度学习训练上,MI60仅每秒334张的处理速度,紧追在V100每秒357张的性能之后。
简单来说RadeonInstinctMI60是世界首款7nmGPU产品,以及第一款支援PCIe4.0的运算加速卡,更达到1TB/s记忆体频宽速度,以及硬体层级虚拟化。
针对HPC有着7.4TFLOPSFP64的性能,对于深度学习的Training有着14.7TFLOPSFP32的性能,至于深度学习Inference有着118TOPSINT4的性能表现。
AMD抢先挺进7nmGPU与PCIe4.0发表RadeonInstinctMI60运算加速卡
AMD「NextHorizon」活动中,不仅揭晓7nmZen2“ROME”EPYC处理器,更抢先挺进7nm製程GPU与PCIe4.0规格,发表首款RadeonInstinctMI60与MI50运算加速卡。
Vega架构优化7nm製程RadeonInstinctMI60运算加速卡
AMD如期推出Vega架构优化并採用7nm製程的GPU「RadeonInstinctMI60」运算加速卡,新製程与架构优化,让GPU电晶体密度提高2倍,更有着1.25倍的性能提升,以及更高的每瓦效能。
MI60着重于「FP64」与「FP32」加速运算,可加速深度学习所需的Training与Inference运算;以及32GBHBM2记忆体,不仅可达到1TB/s记忆体频宽速度,更具备End-to-EndECC保护。
而MI60除了是首款7nmGPU之外,更是首款支援PCIe4.0的绘图处理器;而多GPU之间通过InfinityFabric桥接,可达到100GB/sperLink的连接频宽,而受惠于PCIe4.0可让GPU与CPU之间达到双向Bi-Directional64GB/s的频宽;更支援硬体层级的GPU虚拟化技术。
性能方面,MI60在一般运算如「双精度矩阵乘法(DGEMM)」比起上一代MI25有着8.8倍的性能提升,达到6.717TFLOPS;而深度学习Resnet-5o的影像辨识速度,MI60可达到每秒498张,更是MI25的2.8倍性能提升。
而且在Resnet-5o深度学习训练上,有着近乎倍数的多GPU性能提升,2GPU有着1.99倍性能提升,8GPU更可保持在7.64倍的训练性能提升。
至于MI60与对手TeslaV100相互比较,双精度矩阵乘法(DGEMM),MI60有着6.717TFLOPS快过V100的6.627TFLOPS;至于单精度矩阵乘法(SGEMM),MI60有着14TFLOPS运算能力,亦赢过V100的13.1TFLOPS;只不过,在Resnet-5o深度学习训练上,MI60仅每秒334张的处理速度,紧追在V100每秒357张的性能之后。
简单来说RadeonInstinctMI60是世界首款7nmGPU产品,以及第一款支援PCIe4.0的运算加速卡,更达到1TB/s记忆体频宽速度,以及硬体层级虚拟化。
针对HPC有着7.4TFLOPSFP64的性能,对于深度学习的Training有着14.7TFLOPSFP32的性能,至于深度学习Inference有着118TOPSINT4的性能表现。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
分享:
相关阅读
最新文章
-
上厕所时,发现马桶里的水泛起血色,或是手纸沾着鲜红的痕迹,相信不少人都会心头一紧:"是痔疮犯了?还是……...浏览全文>>
-
最近收到一位患者的留言,说自己这几天总感觉肛门有下坠胀感,特别难受,上网一查,好多信息都指向癌症,这可...浏览全文>>
-
腹痛、腹泻总反复!可能是小肠、大肠在抗议。基于症状特征区分小肠疾病与大肠疾病的具体差异分析:一、核心症状...浏览全文>>
-
近日,中国中医药信息学会肛肠分会·肿瘤分会·治未病分会·河北名医学会肛肠分会·盆底与便秘分会·河北省中...浏览全文>>
-
安徽蚌埠的长安启源E07作为一款备受关注的新能源车型,其价格和配置一直是消费者热议的话题。如果你正考虑入手...浏览全文>>
-
近年来,随着新能源汽车市场的快速发展,插电式混合动力车型逐渐成为消费者关注的焦点。生活家PHEV作为一款备...浏览全文>>
-
在2025款生活家PHEV车型正式上市之前,提前了解相关费用明细对于购车者来说至关重要。这款插电式混合动力车型...浏览全文>>
-
大众途昂作为一款中大型SUV,凭借其宽敞的空间和强劲的动力配置,在市场上一直拥有不错的口碑。对于计划购买20...浏览全文>>
-
阜阳地区的长安启源Q05 2025款车型凭借其时尚的外观设计和丰富的配置,吸引了众多消费者的关注。这款车型作为...浏览全文>>
-
阜阳揽巡作为一款备受关注的中型SUV,凭借其豪华的配置和超值的价格吸引了众多消费者的目光。这款车不仅在外观...浏览全文>>
大家爱看
频道推荐
站长推荐