首页 >> 资讯 >

NVIDIA推出NVIDIATeslaP100加速器大幅提升高效能运算应用项目与深度学习表现

2022-05-31 11:12:02 来源：用户：

五项架构性突破让伺服器提供比先前架构机种高出12倍的效能

NVIDIA今天宣布推出史上最先进的NVIDIA®Tesla®P100GPU。

NVIDIATesla加速运算平台的生力军TeslaP100，打造出能提供媲美数百个CPU伺服器节点运算效能的新一代伺服器。目前的资料中心利用其拥有巨大的网路基础架构与众多互连商用CPU伺服器处理网路服务等大量工作，然而却无法因应下一代的人工智慧和科学应用项目，那需要超高效率和光速般处理速度的伺服器节点才能处理。
TeslaP100採用全新NVIDIAPascal™GPU架构与五项突破性技术，提供无与伦比的运算效能表现和效率以处理极为需要运算能力的应用项目。

NVIDIA公司共同创办人暨执行长黄仁勋先生表示：「我们在科学和科技上最大的难题，像是寻找治疗癌症的方法、了解气候变迁的情况、打造智慧的机器等，都需要极致的运算效能。我们从零开始设计PascalGPU架构，从各个层面採用创新的技术，让运算效能和效率方面出现突飞猛进的进展，帮助最聪明、最有才华的人士推动科学、科技的未来发展。」

IBM研究院认知解决方案部门资深副总裁JohnKellyIII博士表示：「随着我们进入崭新的运算时代，便需要对根本的技术发展出全新的方法以完全发挥人工智慧和认知技术的优势。透过结合NVIDIAGPU与OpenPOWER技术，早已加快Watson学习新技能的速度。如今IBM的Power架构与NVIDIA的Pascal架构，再加上NVLink技术，将更进一步提高处理认知相关工作的表现，促进人工智慧产业的发展。」

五项架构突破技术TeslaP100的五项架构突破技术提供极为出色的效能、扩充能力和编程效率：

·NVIDIAPascal架构大幅提升运算效能：与前一代採用NVIDIAMaxwell™架构的解决方案相比，採用Pascal架构的TeslaP100解决方案在训练神经网路方面的效能表现提升了12倍。
·NVIDIANVLink技术让应用程式拥有最大的扩充能力：NVIDIANVLink™高速GPU互连技术将应用程式的运算範围扩大到多个GPU上，频宽较目前同级最佳解决方案速度提高5倍1。NVLink最多可互连8个TeslaP100GPU，使得单一节点发挥最高应用效能，而IBM已在其POWER8CPU上採用NVLink技术，以求在CPU与GPU间能快速传递资料。
·16奈米FinFET拥有优秀的省电表现：Pascal架构GPU採用16奈米FinFET製程技术製造出的153亿个电晶体，为全球史上最大的FinFET晶片2，这样的设计提供最高运算速度和最佳省电表现，以处理有着近乎无止尽运算需求的作业负载。
·CoWoS技术搭载HBM2记忆体以处理巨量资料作业负载：Pascal架构将处理器和资料纳入单一封装中以提供卓越的运算效率。创新的ChiponWaferonSubstrate(CoWoS)记忆体设计技术搭载HBM2记忆体，在记忆体频宽表现方面比Maxwell架构提升了3倍(每秒720GB)。
·崭新的人工智慧演算法拥有亮眼的尖峰运算效能表现：全新半精度指令拥有出色的21TFLOPS深度学习尖峰运算效能表现。

TeslaP100GPU加速器将多项高性能运算(HPC)与深度学习应用项目的效能提升到新的境界，包括比起48个双插槽CPU伺服器节点，AMBER分子动力学程序搭配TeslaP100GPU能加快在单一伺服器节点上的运行程度3；在训练热门的AlexNet深度神经网路时，得要250个双插槽CPU伺服器节点才能媲美8个TeslaP100GPU的效能4；而广泛使用的天气预报应用程式COSMO在8个TeslaP100GPU上运行的速度，比在27具双插槽CPU伺服器上运行的速度还要更快5。

TeslaP100是首款能分别为双精度和单精度运算效能提高5与10TFLOPS的加速器，大幅提高处理能力和多个领域研究工作的发现时间。

NVIDIASDK更新项目NVIDIA亦宣布为全球最强大的GPU运算开发平台NVIDIASDK推出更新项目。

这些更新项目包括NVIDIA平行运算平台的最新版本NVIDIACUDA®8，让开发人员能直接取得Pascal强大的新功能，包含统一记忆体架构和NVLink。在更新项目里还有一项全新的图形分析函式库nvGRAPH，可用于机器人的路径规划、网路安全和物流分析，将GPU加速技术的应用範围扩大到巨量资料的分析领域。

NVIDIA还宣布用于深度神经网路的GPU加速基本函式库cuDNNversion5。cuDNN5加入支援PascalGPU、加快用于视讯和顺序数据之递迴神经网路的运算速度，以及额外加强在医疗、石油天然气等产业的使用情况。cuDNN技术加快多个居领导地位的深度学习架构运算速度，包括Google的TensorFlow、加州大学柏克莱分校的Caffe、蒙特娄大学的Theano和纽约大学的Torch，而这些在背后成为Amazon、Facebook、Google等网路巨擘採用的深度学习解决方案。

TeslaP100规格TeslaP100GPU加速器的规格如下：
·搭载NVIDIAGPUBOOST™技术达到5.3TFLOPS双精度效能、10.6TFLOPS单精度效能、21.2TFLOPS半精度效能的水準·搭载NVIDIANVLink技术达到每秒160GB的双向互连频宽·16GB的CoWoSHBM2堆叠记忆体·每秒720GB的记忆体频宽搭载CoWoSHBM2堆叠记忆体·页面移转引擎与统一记忆体架构提高编程能力·ECC保护能力提高了可靠性·针对伺服器进行优化，提供最高级资料中心处理量和可靠性

供货时程全新NVIDIADGX-1™深度学习系统内採用Pascal架构的NVIDIATeslaP100GPU加速器将于6月上市，各大伺服器製造商预计于2017年初开始供货。

支援资源·深度学习影片

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！