开篇
很多朋友对目前A/N两家的图形架构非常有兴趣,这是一件很好的事情,我们也鼓励大家一定程度结合显卡实际性能去了解架构设计的特点,当然有些部分我们也是没办法去深究的,因为厂商(A/N)也并不会透露给我(对)们(手)。对于一些公开的设计我们可以尽量去了解,有的时候真的可以通过对比几代的架构来看出产品设计的趋势,甚至是一些猫腻。我想许多同学会问什么事显卡的图形架构,打一个比方,把显卡比作一个人的话,显卡的架构就相当于人体内部的结构,显卡对不同数据执行运算过程就相当于人体对不同食物进行消化吸收的过程,显卡核心架构执行指令处理数据的不同情况也就相当于我们人体吃不同类型食物可能有不同表现类似,当然不同的是显卡架构一代代可以变化改进,而人体原生的结构恐怕轻易没办法改变了。目前AMD在售的旗舰显卡是FURY X,架构是基于GCN 1.2,NVIDIA的则是TITAN X,架构是MAXWELL,下面我们就来看看这两款产品的架构设计特点。
在介绍之前大家要先了解一个问题,那就是显卡的核心GPU跟CPU的差别,两者的相同点就是GPU和CPU同样是用来执行指令处理数据的单元,同样跟人体一样,GPU和CPU执行指令的过程如果好比人吃东西一样,假如我们面前有几盒菜,首先我们要打开饭盒,然后根据你的口味和身体情况来选择哪些食物可以吃,有的时候还要根据习惯来安排吃东西的顺序,比如点心类的食物我们可能要放在主食之后再吃,然后把你要吃的东西再送进嘴里,吃下去,GPU和CPU的这个过程就是寻址、取指、缓存、判断、队列、发射、执行,其中GPU在每个线程队列执行的时候是要严格按照顺序的,也就是In-Order,而CPU是可以按照“需求”的顺序来打乱排列这些线程的,也就是Out of Order(简称OoO),所以对于没办法“排序”要处理线程的GPU来说就涉及到执行效率这个问题,这也是目前无论是A还是N每一代图形架构都在调整和改进的地方,同时GPU在处理和排序这些线程的能力并没有CPU强,所以有些排列线程的环节是交给CPU来完成的,因为CPU的逻辑运算能力更强,GPU更多的能力则是并行运算(戏称为肌肉运算)。
NVIDIA MAXWELL架构的SMM单元
NVIDIA MAXWELL架构:前面说了GPU强大之处是并行运算,其内部也是有许多重复的单元来并行,AMD和NVIDIA都是如此,其中无论你是GTX960还是TITAN X,架构都是MAXWELL,其中图形架构内的一个完整“模组”我们称为SMM(Maxwell Streaming Multiprocessor)单元,也就是上图,其中一组SMM单元内有四组SM(Straming Multiprocessor)多核流处理器阵列单元,每组SM单元内有32个标量的CUDA Core(最基础的运算单元)我们习惯叫SP流处理器,每个流处理器里面整合了包括单精度FPU和ALU,同时还有8个SFU(特殊函数执行单元,因为有些函数比较特殊复杂,一般的CUDA Core无法执行,所以就设计了SFU)。另外大家注意一下上图的黄色部分,那是PolyMorph Engine 2.0单元,是MAXWELL图形架构中来做几何顶点变换与运算的,我们熟悉的Tessellation曲面细分效果就是在这个单元内完成的,然后大家向下看,蓝色的Instruction Cache是指令缓存,再往下橙色的是Warp Scheduler,这个就是来进行线程调度排序的单元,其中Warp对于N卡来说就是一组待处理的线程,包括32个线程,Warp分配判断就在这个单元内,同时也需要跟CPU打交道,从Warp Scheduler出来的指令要通过下面棕色的单元Dispatch Unit(发射单元)来送到流处理器内,MAXWELL架构的每个SM单元内有两个Dispatch Unit发射单元。其中TITAN X的GM200总共有24个SMM单元,大家可以算一下TITAN X的流处理器数量,这就是MAXWELL基础的架构特点。可能许多同学说3072个流处理器同时工作岂不是很强大,这里就存在一个效率问题,那就是上图中的魅族SM单元内的对应的两个发射单元要进行处理的Warp A和Warp B存在相关性,比如Warp B需要Warp A的运算结果才能执行,那么此时Warp B就要等到第二个周期才能执行,如果所有的SM单元都存在这种情况,那么TITAN X的3072个流处理器只有一半也就是1536个在工作,当然这是最坏的情况。
AMD GCN架构的CU单元
AMD GCN架构:无论你的显卡是7850,或者是R9 390X,再或者是FURY X,架构都是GCN,上图就是AMD GCN架构内的一个完整的运算模组CU(Compute Unit),比如说FURY X就是总共有64个CU,这个CU内还包含了4组16way-SIMDs ALU,这么说可能不是很好理解,其实说白了就是4组并行的ALUs,每组是16个同时以SIMD(单指令多数据)模式工作,比如有一个运算指令进来,那么同时可以处理16个数据。同时上述的4组16way-SIMDs ALU同样需要配合类似N卡MAXWELL线程调度单元,处理的数据称之为Wavefront,等同于N卡的Warp,一个待处理的Wavefront包括64个线程,而在GCN之前的VLIW4架构尽管一个Wavefront也是64个线程但却是VLIW4“规格”的Wavefront,如果存在Wavefront A和Wavefront B的相关性,那么抱歉就算空余ALU同时不管Wavefront C~X是否无关也要等下个周期才能继续执行,而到了GCN这代情况就好了不少,如果遇到上述情况,那么可以绕过B直接执行C、D、E,然后下个周期再执行B、F、G、H。其中魅族CU内还集成了一个Scalar ALU单元,这个单元是类似N卡的SFU,用来执行特殊函数的。而GCN架构除了CU单元还有一个很重要的叫做Geometry Processor的单元,这个单元类似N卡MAXWELL架构中的PolyMorph Engine,用来进行曲面细分等变换操作的单元,其中FURY X的GCN 1.2架构中有4组Geometry Processor,就是下图!当然GCN架构也存在最坏的情况,那就是比如FURY X的4096个流处理器,在每个CU中遇到待处理的Wavefront都存在指令相依性,也就是Wavefront A~N可能都相关需要前面一组的处理结果,最坏的情况就是对于4发射的CU只有1个发射端口可以发送Wavefront,此时FURY X整体有效工作的流处理器则只有1024个,不过这种概率跟前面N卡的TITAN X相同都是很小的概率。
R9 390X 的Hawaii核心图形架构
其中R9 390X是GCN 1.1架构,区别在于比起HD7970的GCN1.0来说在Geometry Processor部分强化很明显,特别是曲面细分效能增强。而GCN架构真正强大的是运算效果,注意这个运算可能不是图形运算,对应每组CU内配备了单元间可共享的缓存,这是要比N卡强的,但是这也消耗了大量的晶体管资源。而GCN对于线程调度同样是比较“挑食”的,所以AMD也表示目前GCN架构的显卡在DirectX 12上面的表现会更好,因为DircetX 12下的线程执行效率更迎合GCN架构。当然在DX12还没出来,具体表现如何还要看显卡在真正支持DX12游戏中的表现。
包装
目前GTX970与同级别的R9 390售价均为2K~2K6,其中GTX970价格跨度略大,从1999到2699元,这个级别算是主攻大型单机游戏的高端显卡了,相信不少热衷PC大作游戏的同学也都是在用这个级别的显卡。今天为大家介绍的这款讯景R9 390 8GB黑狼限量版并不是普通的R9 390,而是一款可以通过BIOS切换“变身”成R9 390X 8GB的390,也是通常意义说的“开核”。其实R9 390本身经过催化剂到深红Crimson驱动的过渡在一些大型单机游戏方面也有提升,特别是在2K和4K分辨率高画质下的表现甚至要小胜GTX970,所以能开核的R9 390的性能表现更是期待,当然价格也让我们很感兴趣。
讯景R9 390 8GB 黑狼限量版包装
包装
讯景黑狼系列显卡在这代AMD 300系显卡上面全面采用了黑狼新版的包装,并且R9系列又用回了当年讯景专利的X型包装,个性十足,如果你是第一次见到这款包装,恐怕不用猜也知道这是一款游戏卡,其中相比普通版本的R9 390黑狼的包装,这款在包装右上角有限量版醒目字样,并且这款R9 390采用的是GDDR5 8GB容量显存。
包装正面
参数表
讯景R9 390 8GB黑狼限量版采用的其实跟390X相同的Hawaii XT核心,但未开核流处理器为2560个,开核后提升到2816,也就是打开了屏蔽的4组CU,总共256个流处理器单元,并且开核后核心频率也从1015MHz提升到了1060MHz,512bit位宽的8GB GDDR5显存更适合高分辨率下的游戏应用,供电采用8pin+6pin,目前这款R9 390 8GB黑狼限量版将在近期上市,售价尽管还没最终确定,但是预计为2699元,相当于目前GTX970价格上限的水平,但8GB GDDR5显存+变身R9 390X的福利对于这个价格来说还真是太有诱惑力了!
整体
讯景R9 390 8GB 黑狼限量版
整体
显卡长约为28.2cm,卡高约为12.7cm,标准的长卡,同时因为散热器体积较大也要比一般的显卡稍高一些。显卡采用的是全塑料外罩+铝合金骨架+铝合金背板的加固结构,正面两颗90mm四线PWM温控风扇,扇叶有做过静音化处理,最高转数可达4000rpm。
整体
散热器外罩有三角形图案的镜面化处理,如果仔细看的话能发现最外缘的两排三角形镜面部分是有一定的内陷的角度。
整体
整体
正面
背面铝合金背板
背板特写
R9 390 8GB 黑狼限量版的金属背板跟普通黑狼390系列是相同的,都是铝拉丝处理,对应核心和供电部分PCB背面有六角开孔以供散热,这个金属背板主要是为了防止加固PCB,防止长时间过热后PCB变形,其实PCB一定程度变形是允许的,但是对于这类大核心高端卡来说PCB变形很可能会引起核心的脱焊,那样的话就不好了。
接口部分
接口采用了DP 1.2、HDMI与双DVI接口,同时镀镍的挡板顶部还有标志性的XFX logo镂空出风口。
在显卡前部PCB顶端有“开核”用的BIOS切换开关 默认是R9 390档
这个开关可以在显卡工作中开启,但是需要重启后才能识别对应的核心状态,我想开核重启后打开GPU-Z识别成R9 390X的心情一定是挺开心的。
8pin+6pin 外接供电
接口卡扣朝里,可能有时候会拔插有点麻烦,对于经常拔插显卡的同学可以用外接延长线解决。
拆解&散热
首先说一下这款显卡拆解散热器会影响质保,所以没有特殊情况不建议拆解。
拆下散热器
散热器是最好拆解的,拧下与PCB固定的四颗螺丝后就可以打开散热器,底部还有风扇与PCB固定的四针插线。
散热器内部特写
散热器内部特写
纯铜底座+7热管
热管与底座接合处特写
热管末端特写
热管特写
全铝鳍片与热管是采用焊接工艺,导热效果优秀,这也是为什么这张R9 390即使在开核后也拥有和970一个水平的温度,表现优秀。
热管与鳍片焊接部分特写
PCB
R9 390 8GB 黑狼限量版显卡 分解图
正面有PCB加固骨架和供电部分Mosfet散热片
正面能看到16个显存颗粒 单颗容量512MB
PCB
亚光黑PCB元件焊接非常规整,同时我手上的这张卡也没有发现有PCB有什么瑕疵,基于R9 390公版设计,由于本身AMD R9 390公版的PCB就已经算很豪华了,供电输出完全没有压力,即使开核成R9 390X也是没有压力的。
TSMC 28nm制成的Hawaii XT核心拥有62亿晶体管
PCB背面做工同样工整 核心背面的大量MLCC
供电
供电部分特写 主控和Mosfet是全IR方案 电容也是全日系方案
供电采用的是基于IR3567B主控的6+1相数字供电,这里跟大家说一下看一款显卡的供电相数不要看电容,也不要单纯看电感,要看供电主控和Mosfet Driver IC,这里讯景R9 390 8GB 黑狼限量版的Mosfet Driver IC在PCB背面,我们后面会给大家介绍的。
IR3567B数字PWM主控
最多支持6+2相供电,IR3567B基于AMD VR12.5 Rev 1.3供电规范, 可以实现200kHz~2MHz每相独立控制能力,支持IR动态相数控制,就是说对于低负载情况下可以让几相供电空闲以优化元件寿命,高频控制同时对Mosfet开关管的要求也是很高的,所以这款显卡连同Mosfet也是采用IR的顶级方案,没有后顾之忧。
每相供电对应的是IR6894+IR6811 上下桥Mosfet
Mosfet采用的是DircetFET封装 这也是目前板卡Mosfet中成本最高和开关频率最高的方案
DircetFET是IR专门针对DC高频开关供电的Mosfet封装方案,金属外壳是铜合金,铜壳直接作为Mosfet的漏极,散热效果优秀,同时体积小便于增加散热片。其中IR6894高温下拥有1.3mΩ内阻,25A通过电流设计,150℃耐温。
输出电容采用的是尼吉康FP系列固态电容与大量MLCC陶瓷电容并联
大家看到小黄豆粒样子的就是MLCC贴片陶瓷电容,这种电容并联后拥有极低的ESR,高频响应更加优秀,特别是对于高频供电方案非常优秀。
对应每相在PCB背面的Mosfet Driver IC 就是驱动Mosfet工作的芯片
Mosfet Driver IC 特写
VCCIO供电特写
W4032BABG-60-F显存颗粒 单颗容量512MB GDDR5规格
平台
关闭CPU的EIST和C-STATE,频率锁定为4.4GHz,内存频率锁定为2133,时序设定为10-11-11-24 1T,测试的GTX970规格为1114MHz核心,显存频率为1753MHz,驱动采用的是ForceWare 361.91 WHQL,同样将功耗和温度上限开满以获得最佳性能表现。
硬件平台
Radeon Crimson 16.1.1 WHQL 驱动 将功耗限定设定为+50%
GPU-Z 信息
GPU-Z 信息(开核后)
3DMark11果然是N卡一贯优势项目,即便是开核成R9 390X拥有1060MHz核心频率后也没超过GTX970。
3DMark FireStrike Extreme模式是2K分辨率默认设定,本身R9 390就领先GTX970,开核后拥有2816个流处理器的R9 390黑狼成绩领先GTX970约为11%。而当分辨率进一步提升到Ultra模式的3840×2160,领先幅度也提高到了13%。
注重曲面细分效能测试的Unigine Heaven项目也是N卡一贯的优势项目,还记得在GTX480发布时候演示Tessellation效能的就是这个软件,但是如今显卡的表现已经今非昔比了。R9 390 8G不开核状态下落后GTX970意料之中,开核后达成了小幅反超。而当分辨率进一步提高到3840×2160后,GTX970的优势就不在了,不开核就可以打成平手了。
以上三个基准测试项目基本上不涉及到爆显存的情况,显存占用率都在2GB以内。
以下游戏均采用2560×1440分辨率,画质和特效开到最高,抗锯齿不开或者设定为FXAA,显存占用率控制在4GB以内。
《巫师3》项目R9 390不开核状态下领先GTX970约为10%,开核后领先幅度达到了15%,领先幅度一般。
《使命召唤11》测试中R9 390 8GB黑狼默认领先GTX970幅度13%约为,开核后领先幅度约为19%。
《孤岛危机3》是A卡的优势游戏,默认BIOS领先GTX970约为14%,开核后领先幅度达到了22%,体验帧数差距很明显。
《孤岛惊魂4》中R9 390 8GB黑狼领先幅度也是相当大,默认即领先22%,开核后领先幅度达到了29%,估计即使是980也要汗颜了。
《GTA5》测试中GTX970领先R9 390 8G黑狼约为3%,但开核后R9 390 8G黑狼即完成了反超,这也是游戏测试中GTX970唯一领先R9 390 8GB黑狼的一个项目。
《中土世界:魔多阴影》是一款NVIDIA占优的游戏,但其实在这个分辨率和画面设定情况下GTX970表现并不理想,默认BIOS的R9 390 8GB黑狼领先GTX970约为14%,开核后领先幅度达到了20%!
温度&功耗
得益于讯景R9 390 8GB限量版8GB的散热器设计,默认BIOS下温度表现要好于GTX970,这是比较难得的,而再开核后温度增加还是稍有明显的,也超过的GTX970,但平均游戏温度表现也都没有超过80℃。
如果你非常在意功耗,那么GTX970才是真爱,因为功耗表现实在是很优秀,待机情况R9 390 8GB黑狼跟GTX970没什么区别,游戏中平均平台功耗R9 390 8GB黑狼在开核后超过了GTX970的70%之多,即使不开核也要多出近60%,所以如果要搭配这款开核的R9 390 8GB黑狼显卡,电源选择至少额定550W的型号,推荐选择600W型号。
总结
拥有开核功能后重启一次变身R9 390X,在2560×1440高特效游戏中的表现相比开核之前提升范围在5%~10%之间,但官方提供2年质保的光环下让这种开核玩法更加放心,PCB延续了公版的元件规格的高冗余和可靠,实际使用测试中也没有发现什么啸叫情况,7根6mm纯铜热管焊接工艺的散热器非常给力,在功耗比GTX970高的情况下温度综合控制的跟GTX970不相上下,如果分辨率在3840×2160的环境下,相信R9 390 8GB黑狼限量版的优势将更加明显,而在1920×1080的分辨率下GTX970则会缩小差距,一般用390或者GTX970这类卡的玩家想必显示器到了27寸或者30寸这个级别,2K分辨率是需要首要考虑的。最后一句话是,如果你只是想在1920×1080下体验高画质下的流畅,那么一张R9 280X既可以满足你,但分辨率上到2560×1440的话,你需要的是R9 390或者GTX970这样级别的显卡,R9 390 8GB 黑狼限量版显卡在2700附近的范围内的话是很不错的选择,当然前提是你的电源额定最好不要低于550W!
讯景R9 390 8GB 黑狼限量版
|