在GTC 2017大上,NVIDIA正式发布了史上最强大的核弹--旗舰计算卡Tesla V100。 Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核心频率为1455MHz,搭载16GB HBM2显存,单精度浮点性能15 TFLOPS,双精度浮点7.5 TFLOPS,显存带宽900GB/s。 此外,Tesla V100还增加与深度学习高度相关的Tensor单元,Tensor性能号称可以达到120 TFLOPS。如此“堆料”让Tesla V100拥有超过210亿个晶体管,核心面积达到了创纪录的815平方毫米,采用的是12nmFFN工艺制造(其实是16nm深度改良)。 作为对比,上代旗舰Tesla P100不过只有3584个CUDA核心,拥有153亿个晶体管,核心面积610平方毫米(16nm FET+工艺)。同时,Tesla V100的二级缓存及寄存器大小也有所增加,L2缓存由Tesla P100的4096KB增加到了6144KB,每组SM单元的寄存器文件大小总数从14336KB增加到了20480KB。 NVIDIA表示,Tesla V100将首先用在用于深度学习超算DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。 价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。 |
手机版|外设堂 ( 辽ICP备13014379号 )辽公网安备 21010202000549号
GMT+8, 2024-11-23 15:11 , Processed in 0.068615 second(s), 15 queries , Gzip On.
Powered by Discuz! X3.4
Copyright © 2001-2021, Tencent Cloud.