首页 > 资讯 > 正文

GTC2017NVIDIA发表Volta架构TeslaV100运算核心

导读 今年 GTC 2017 会场中 NVIDIA黄教主-黄仁勋先生,于活动中谈及莫尔定律、多人 VR 应用 Project Holodeck、深度学习的 Ray Trac



今年GTC2017会场中NVIDIA黄教主-黄仁勋先生,于活动中谈及莫尔定律、多人VR应用ProjectHolodeck、深度学习的RayTracing技术,以及首款基于「Volta」架构的TeslaV100运算核心。

TeslaV100为Volta第一款运算核心产品,它拥有21亿个电晶体核心,採用台积电12nmFinFET製程,晶片面积达到815mm平方;TeslaV100具备5120个CUDA运算单元,运算能力达到7.5FP64TFLOPS、15FP32TFLOPS;而TeslaV100有着新的TensorCore,可用于深度学习运算使用,并具备120TensorTFLOPS运算能力。TeslaV100有着16MB快取,以及16GBHBM2记忆体,记忆体速度达到900GB/s,还有着300GB/sNVLink高速户连能力。


↑TeslaV100实体。


而所谓的新「TensorCore」,主要是提供深度学习新的CUDATensorOp指令与资料格式。在上一代Pascal架构下,运算4×4阵列运算,例如求D[FP32]=A[FP16]*B[FP16]+C[FP32]的4维运算时,Pascal仅能依照顺序一次运算一组行*列后才能求出解答。但在Volta架构下,可以在同一时间进行4*4的运算,换句话说Pascal一次只能运行单一行*列运算,而Volta可一次运行4组行*列运算,并提升了12X的Throughput运算输出能力。


↑TensorCore。


总结来说,Volta运算效能比起上一代Pascal架构,提升了1.5X于基本HPCFLOPS运算能力、提升12X深度学习训练TensorFLOPS、提升6X深度学习推理TensorFLOPS之速度。


↑TeslaV100效能总结。


而活动中,黄教主也提到TeslaV100当然可进行绘图运算,因此展示与SQUAREENIX透过TeslaV100进行即时影像渲染Kingsglaive:FinalFantasyXV展示。而NVIDIADGX-1将会搭载TeslaV100运算核心,有着960TensorTFLOPS运算能力、8张TeslaV100运算核心、NVLinkHybridCube,将原本TITANX需要8天的运算时间,变成只要8小时,而价格则是美金$149,000元。


↑NVIDIADGX-1。


另外,考量到有些企业可能没有积架伺服器的资料中心,因此NVIDIA推出DGXSTATION,也就是接近桌上型电脑的尺寸,让企业在部属深度运算伺服器时更容易部属。DGXSTATION有着480TensorTFLOPS运算能力、4张TeslaV100运算核心,并採用NVLink,以及有着3DisplayPort、1500W电源与水冷散热,这台只要美金$69,000美元。而TeslaV100亦有提供给HyperscaleInference使用的PCIeFHHL运算卡(像是DGXSTATION当中使用的运算卡),需要150W供电,而且比起Skylake有着15-25XInference运算速度。


↑DGXSTATION。


↑DGXSTATION内部(超帅)。


↑TeslaV100PCIeFHHL。


↑TeslaV100PCIeFHHL。


若各位有兴趣了解,此次GTC2017NVIDIA发表会上的资讯,可参当时的直播影片:ustream.tv/gpu-technology-conference

免责声明:本文由用户上传,如有侵权请联系删除!

标签:

Copyright @ 2015 -2023 太行之窗 All Rights Reserved. 网站地图 | 百度地图 .