您现在的位置是：首页 > 资讯 > 正文

GTC2017NVIDIA发表Volta架构TeslaV100运算核心

发布时间：2023-01-22 09:04:03来源：

导读今年 GTC 2017 会场中 NVIDIA黄教主-黄仁勋先生，于活动中谈及莫尔定律、多人 VR 应用 Project Holodeck、深度学习的 Ray Trac

今年GTC2017会场中NVIDIA黄教主-黄仁勋先生，于活动中谈及莫尔定律、多人VR应用ProjectHolodeck、深度学习的RayTracing技术，以及首款基于「Volta」架构的TeslaV100运算核心。

TeslaV100为Volta第一款运算核心产品，它拥有21亿个电晶体核心，採用台积电12nmFinFET製程，晶片面积达到815mm平方；TeslaV100具备5120个CUDA运算单元，运算能力达到7.5FP64TFLOPS、15FP32TFLOPS；而TeslaV100有着新的TensorCore，可用于深度学习运算使用，并具备120TensorTFLOPS运算能力。TeslaV100有着16MB快取，以及16GBHBM2记忆体，记忆体速度达到900GB/s，还有着300GB/sNVLink高速户连能力。

↑TeslaV100实体。

而所谓的新「TensorCore」，主要是提供深度学习新的CUDATensorOp指令与资料格式。在上一代Pascal架构下，运算4×4阵列运算，例如求D[FP32]=A[FP16]*B[FP16]+C[FP32]的4维运算时，Pascal仅能依照顺序一次运算一组行*列后才能求出解答。但在Volta架构下，可以在同一时间进行4*4的运算，换句话说Pascal一次只能运行单一行*列运算，而Volta可一次运行4组行*列运算，并提升了12X的Throughput运算输出能力。

↑TensorCore。

总结来说，Volta运算效能比起上一代Pascal架构，提升了1.5X于基本HPCFLOPS运算能力、提升12X深度学习训练TensorFLOPS、提升6X深度学习推理TensorFLOPS之速度。

↑TeslaV100效能总结。

而活动中，黄教主也提到TeslaV100当然可进行绘图运算，因此展示与SQUAREENIX透过TeslaV100进行即时影像渲染Kingsglaive:FinalFantasyXV展示。而NVIDIADGX-1将会搭载TeslaV100运算核心，有着960TensorTFLOPS运算能力、8张TeslaV100运算核心、NVLinkHybridCube，将原本TITANX需要8天的运算时间，变成只要8小时，而价格则是美金$149,000元。

↑NVIDIADGX-1。

另外，考量到有些企业可能没有积架伺服器的资料中心，因此NVIDIA推出DGXSTATION，也就是接近桌上型电脑的尺寸，让企业在部属深度运算伺服器时更容易部属。DGXSTATION有着480TensorTFLOPS运算能力、4张TeslaV100运算核心，并採用NVLink，以及有着3DisplayPort、1500W电源与水冷散热，这台只要美金$69,000美元。而TeslaV100亦有提供给HyperscaleInference使用的PCIeFHHL运算卡（像是DGXSTATION当中使用的运算卡），需要150W供电，而且比起Skylake有着15-25XInference运算速度。

↑DGXSTATION。

↑DGXSTATION内部（超帅）。

↑TeslaV100PCIeFHHL。

↑TeslaV100PCIeFHHL。

若各位有兴趣了解，此次GTC2017NVIDIA发表会上的资讯，可参当时的直播影片：ustream.tv/gpu-technology-conference

标签：

您现在的位置是：首页 > 资讯 > 正文

GTC2017NVIDIA发表Volta架构TeslaV100运算核心

猜你喜欢

最新文章