架构解析之三大核心与型号 图灵家族除了架构本身变化巨大,产品体系也和以往明显不同,首发一口气就是三款型号RTX 2080 Ti、RTX 2080、RTX 2070,而且分别对应三个不同核心TU102、TU104、TUF106,而以往的x80、x70都是共享一个核心。 具体原因不详,可能是新一代核心太大,x70直接用大核心阉割成本比较高,还不如再造一个省钱的小核心。 这就是最顶级的TU102核心,186亿个晶体管、754平方毫米面积确实不是盖的。 内有4608个CUDA核心,分为6组GPC、36组TPC、72组SM阵列(每组SM 64个CUDA核心),同时有72个RT核心、576个Tensor核心、288个纹理单元、96个ROP光栅单元,二级缓存容量6MB,寄存器文件18MB,352-bit位宽。 不过,RTX 2080 Ti并未完全使用整个TU102核心,而是有所精简,仅提供4352个CUDA核心(68组SM阵列),RT核心则减少为68个,Tensor核心544个。 目前只有Quadro RTX 8000用了完整的TUF102,可能是初期良品率不足,优先供给专业市场,也可能是功耗和发热在游戏卡上不好控制,还有可能是留一手…… RTX 2080 Ti的核心频率基础为1350MHz,加速频率FE公版做到了1635MHz,非公版则规定是1545MHz,当然大家可以随意超频。 显存搭配11GB GDDR6,等效频率14GHz,带宽为616GB/s,整卡功耗260W。 TU104核心,136亿个晶体管,545平方毫米,比帕斯卡家族的大核心GP102都要大一圈。 它集成了3072个CUDA核心,划分为6组GPC、24组TPC、48组SM(每组SM还是64个),同时有192个纹理单元、64个ROP单元、384个Tensor核心、48个RT核心,二级缓存容量4MB,寄存器文件12MB,显存位宽256-bit。 RTX 2080同样没有用满TU104核心,而是精简了两组SM,提供2944个CUDA核心、368个Tensor核心、46个RT核心,完整版还是在专业卡上,Quadro RTX 6000。 RTX 2080核心基础频率1515MHz,加速频率非公版1710MHz,公版直接定在1800MHz,搭配8GB GDDR6显存,等效频率14GHz,带宽448GB/s,功耗225W。 它的渲染性能为60 TRX-OPS,相比于RTX 2080 Ti削弱了23%,光线追踪性能8 GigaRays/s(每秒80亿条光线),削弱了20%。 TU106核心,108亿个晶体管,445平方毫米,相比GP102也只是分别差了10%、6%,更可见图灵家族的庞大。 TU106核心內建2304个CUDA核心,分为3组GPC、18组TPC、36组SM阵列(每组继续64个),同时有144个纹理单元、64个ROP单元、288个Tensor核心、36个RT核心,二级缓存容量4MB,寄存器文件9MB,显存位宽还是256-bit。 RTX 2070终于用了完整的TU106核心,核心频率基础1410MHz,加速公版1710MHz、非公版1620MHz,继续搭配8GB 14GHz GDDR6显存,功耗185W。 渲染性能45 RTX-OPS,相比于RTX 2080 Ti、RTX 2080分别低了25%、42%,光线追踪性能6 GigaRays/s(每秒60亿条光线),分别低了25%、40%。 图灵家族三大核心与帕斯卡家族大核心GP102对比。 |
手机版|外设堂 ( 辽ICP备13014379号 )辽公网安备 21010202000549号
GMT+8, 2024-11-23 23:21 , Processed in 0.077563 second(s), 15 queries , Gzip On.
Powered by Discuz! X3.4
Copyright © 2001-2021, Tencent Cloud.