RTX 3080出生两个月卒!Radeon RX 6800 6800 XT首发评测
RTX 3080出生两个月卒!Radeon RX 6800 6800 XT首发评测
一、前言:出乎所有人预料的RDNA2构架
2020年9月4日,当NVIDIA基于新一代Ampere安培架构的GeForceRTX30系列显卡发布之时,几乎在所有玩家的内心都默默的宣判了AMD的死刑。
因为此前在流处理器数量相同的情况下,同时代的NVIDIA显卡性能是远强于AMD显卡,就算是RDNA构架也不能难幸免。RX5700XT无法战胜拥有相同2560个流处理器数量的RTX2070Super,前者是7nm,后者是12nm。
新一代RTX3090一上来就宣告拥有10496个流处理器,带来的震撼可想而知!至于传说中的RDNA2,很早之前大家就知道了,它最多拥有5120个流处理器。恐怕那时没人会觉得RNDA2会威胁到RTX3090,甚至RTX3080都可以高枕无忧。
不过如同Zen3处理器带给大家的震撼一样,10月29日发布的RDNA2GPU的实际性能表现几乎超出了所有人的预料!
RDNA2虽然是RDNA架构的更新版本,并不是完全重新设计。但在RDNA原有的基础上,RDNA2性能提升1倍,能效提升至少50%,ROP单元翻倍,完整支持DX12Ultimate等技术特性,支持硬件光线追踪。
以上是RDNA、RDNA2两代架构图,可以发现整体布局没有太大变化,当然各个功能模块都是调整优化过的,而最突出的,一是增加了独立的InfinityCache高速缓存,二是在每个计算单元内加入了专用的光追加速器RayAccelerator。
至于RDNA2架构的底层细节,比如说计算单元的变化,AMD这次没有给出更多资料,只是简单提到了几点,包括精简TLB以降低延迟、重新设计32位像素流水线并支持HDR格式、优化几何分派与曲面细分、全方位精细时钟门控、频率树分离与门控、最小化数据转移、重新平衡流水线、高性能库等等,但没有任何图示。
以下是RDNA2构架新技术解析:
1、SmartAccessMemory(SAM)显存智取技术
在游戏运行的时候,CPU是不能一次性访问全部显存的,比如RTX3090有24GB显存,而CPU只能访问其中的256MB。于是有大量数据会回到内存后给CPU处理器完成后再转移到显存,此时不仅浪费了带宽也造成了无谓的资源浪费。
SmartAccessMemory(SAM)可以让搭载AMD500系列芯片组在搭载Zen3CPU和RDNA2GPU的时候,让Zen3CPU可以完整访问全部显存,而且带宽还是PCIe4.0的速度,理论上最多可以让游戏性能提升13%。
2、RayAccelerator单元
在RDNA2构架中,加入了硬件光追单元RayAccelerator!与NVIDIA的完全专用RTCore相比,RDNA2的RayAccelerator紧密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的现有HW。
这是AMD放出的RNA2光追渲染效果图,可以看到RDNA2实时光线追踪效果与传统光栅化渲染的差别。
AMD声称,相比于软件方案,RDNA2架构的硬件加速光追性能,可以提升10倍之多,同时给出了部分游戏的实际性能,2K分辨率下《使命召唤:现代战争》可以跑出95FPS,《孤岛危机重制版》可达90FPS,《战地5》能有70FPS。
3、全局InfinityCache
在大容量三级缓存的加持下,Zen3的IPC性能获得了巨大的性能提升。如今AMD将这个理念带入了GPU领域。
传统的GPU构架中,一般只有1.5~4MB的缓存,RDNA2除了4MB的L2缓存之外,还加入了128MB的全局InfinityCache缓存,所有的CU单元均可以访问。
AMDInfinityCache作为一个巨大的带宽放大器,其有效带宽可以达到256位16GbpsGDDR6显存的4倍。在InfinityCache的带动下,512GB/s带宽的RX6900XT的性能表现足以媲美936GB/s带宽的RTX3090。
4、FidelityFX超分辨率抗锯齿技术
针对NVIDIADLSS深度学习超采样抗锯齿技术,AMD也提出了超分辨率(FidelityFXSuperResolution),简称FSR。目前这个技术正在开发中,不久之后会在新驱动中提供支持
历代AMD显卡在ROP单元数量上都非常保守,最顶级型号的GPU最多就只有64个ROP。这一次AMD非常的激进,RX6800XT直接就配备了128个ROP,也是GPU历史上第一款拥有128个ROP的显卡。
二、RX6800XT图赏:2.5槽厚度整块均热板散热
第一次采用三风扇设计的AMD公版显卡。
顶部视角图,双8pin供电接口。
“RADEON”LOGO通电后可以发光。
公版在散热方面不计成本,没有用热管取而代之的是大面积的均热板,整个面板就是一个大均热板。
显存以及MosFET部分也贴有导热垫。
PCB裸照,15+2相供电电路设计,理论上应付500W的功耗都没问题。
供电电路的钽电容在PCB板背面。
背部的钽电容以及CPU背面高密度的MLCC电容。
Navi21GPU核心,芯片面积519mm2,268亿个晶体管。
旁边是三星GDDR6显存颗粒,频率16GHz,单颗容量2GB,一共8颗组成256Bit16GB,显存带宽达到了512GB/s。
三、RX6800图赏:与RX6800XT的差别只在于厚度
外观与RX6800XT一样,同样是3个风扇。
全尺寸的金属背面。
底部视角图。
顶部视角图,同样也是双8Pin供电接口,不过显卡比RX6800XT薄不少,一个是2.5槽,一个是2槽。
顶部的“RADEON”LOGO不能发光。
2个DP1.4、1个HDMI2.1以及Type-C接口。
与RX6800XT一样,同样也是整块均热板设计,没有热管。
PCB板与RX6800XT长得一模一样,同样也是17相供电电路,应对250WTDP的RX6800有些大材小用。
GPU核心周围有8颗三星GDDR6显存,总容量16GB,频率16GHz,带宽512GB/s。
供电电路的钽电容也在PCB板背面。
四、测试平台:i9-10900K+锐龙95900X双平台
测试平台如下:
处理器选择了i9-10900K和锐龙95900X。其中i9-10900K超频到了全核心5.2GHz,锐龙95900X是默频使用。
想要测试SmartAccessMemory(SAM)显存智取技术必须3A平台。
微星MEGX570GODLIKE超神板主板是微星在AM4平台最为顶级的主板,采用EATX板型构造,8+8Pin供电接口,18相供电电路设计,可以为处理器提供超过千瓦的供电功率。
最关键的是,X570GODLIKE超神板最新的BIOS可以完美支持4200MHz频率的内存。
芝奇皇家戟F4-4000C15D8GBx4套装,不仅拥有4000MHz的频率,15-16-16-36的时序也是低的吓人,比绝大部分3000MHz频率的内存都要低,不过默认电压1.5V也算是比较高的了。
长江存储致钛PC005Active512GBSSD,顺序读写速度分别为3500MB/s,2900MB/s。不依赖模拟SLC缓存也能保持550MB/s的稳定写入速度,同时寿命远远高于市面上绝大多数TLCSSD。
酷冷至尊P360ARGB水冷散热器,应该是市面上颜值最高也最易安装的水冷散热器,可以很轻松的压制5.2GHz的i9-10900K处理器。
XPGCOREREACTOR850GOLD电源,全模块化设计,单路12V输出电流70.8A,12V输出功率达到了850W。
120mmFDB液体动态轴承风扇。
华硕玩家国度PG27UQROG27英寸IPS电竞显示器。
4KUHD(3840*2160)分辨率、4ms响应时间、144Hz刷新率、G-Sync技术、IPS+量子点面板、10bit色彩、DisPlayHDR1000认证。依旧是目前市面上顶级的电竞显示器。
五、理论性能测试:3DMark比RTX3090还强默认运行频率可达2.45GHz
1、3DMark
首先是RX6800,在2K分辨率3DMarkFireStrikeExtreme测试中,RX6800图形分数达到了21472分,核心温度最高69℃,核心运行最高频率为2237MHz,显卡最大功耗达到了205W。
在3DMarkFireStrikeUltra测试中,RX6800图形分数为10551分,核心温度最高68℃,核心运行最高频率为2238MHz,显卡最大功耗达到了206W。
接着是RX6800XT!
在2K分辨率3DMarkFireStrikeExtreme测试中,RX6800XT的图形分数达到了25438分,核心温度最高72℃,核心运行最高频率为2441MHz,显卡最大功耗达到了281W。
在3DMarkFireStrikeUltra测试中,RX6800图形分数为12598分,核心温度最高75℃,核心运行最高频率为2445MHz,显卡最大功耗达到了280W。
3DMarkFireStrike的测试,RX6800XT的分数创了记录,2K分辨率下的图形分数达到了25438,比RTX3090还要高9%,不过4K分辨率下领先优势降到了4%。
而RX6800同样可以越级,不论是2K还是4K分辨率的图形分数都与RTX3080相当。相比RTX3070,可以领先25%左右。
2、3DMarkTimeSpy
在2K分辨率3DMarkTimeSpy测试中,RX6800图形分数达到了15099分,核心温度最高68℃,核心运行最高频率为2225MHz,显卡最大功耗达到了243W。
在4K分辨率3DMarkTimeSpyExtreme测试中,RX6800图形分数为7146分,核心温度最高69℃,核心运行最高频率为2225MHz,显卡最大功耗达到了218W。
接下来是RX6800XT!在2K分辨率3DMarkTimeSpy测试中,RX6800XT图形分数达到了17871分,核心温度最高74℃,核心运行最高频率为2313MHz,显卡最大功耗达到了265W。
在2K分辨率3DMarkTimeSpyExtreme测试中,RX6800图形分数为8487分,核心温度最高78℃,核心运行最高频率为2434MHz,显卡最大功耗达到了314W。
3DMarkTimeSpy的分数比较贴近于实际表现,在2K分辨率下RX6800XT比RTX3080快了1%,4K则被反超了4%。
RX6800的情况要好一些,2K分辨率下比RTX3070快了10%,4K分辨率下也有6%的优势。
六、2K游戏测试:RX6800碾压RTX3070,RX6800XT比RTX3080快1%
1、APEX英雄
2、使命召唤16:战区
3、GTAV
4、刺客信条:奥德赛
5、德军总部:新血脉
6、地平线:零之曙光
7、孤岛惊魂5
8、古墓丽影:暗影
9、绝地求生
10、微软模拟飞行2020
11、死亡搁浅
12、巫师3
13、无主之地3
14、战地5
15、战争机器5
RX6800/6800XT这样的显卡应该不会有多少人会在1080P分辨率下进行游戏,不过我们还是测试了他们在1080P下的帧率,数据汇总如下:
在1080P分辨率下,RX6800XT的表现非常接近RTX3090,比RTX3080则快了3%。
RX6800比RTX3070也快了8%。
2K分辨率下,RX6800XT的领先优势有点缩小,比RTX3080只快了1%。RX6800相比RTX3070领先优势从1080P的8%提升到了11%。
4K分辨率更需求显存带宽,此时RTX3080已经反超了RX6800XT,领先幅度达到了4%。
RX6800表现尚可,依旧比RTX3070快了9%。
八、3A平台免费的午餐:SAM技术可以让默频锐龙95900X超越5.2GHz的i9-10900K
在游戏运行的时候,CPU是不能一次性访问全部显存的,比如RTX3090有24GB显存,而CPU只能访问其中的256MB。于是有大量数据会回到内存后给CPU处理器完成,再转移到显存,此时不仅浪费了带宽也造成了无谓的资源浪费。
SmartAccessMemory(SAM)可以让搭载AMD500系列芯片组在搭载Zen3CPU和RDNA2GPU的时候,让Zen3CPU可以完整访问全部显存,而且带宽还是PCIe4.0的速度,理论上最多可以让游戏性能提升13%。
要开启SmartAccessMemory(SAM),需要将主板的BIOS更新到最新的版本,在新BIOS中启用Above4GDecode、Re-SizeBARSupport这2个选项就行了。
下面我们在微星X570GODLIKE超神板和锐龙95900X平台上测试SmartAccessMemory(SAM)技术带来的提升。
1、刺客信条:奥德赛
在《刺客信条:奥德赛》中,开启SAM之后,在1080P分辨率下的提升比较明显,达到了5%,2K只有2%的提升,4K干脆没有。
2、德军总部:新血脉
这个游戏很奇怪,开启SAM技术之后,1080P分辨率下的帧率竟然出现了大幅度的下降。
不过2K分辨率下提升了3%,4K分辨率也有4%的帧率提升。
3、地平线:零之曙光
在开启SAM之后,1080P和2K分辨率的帧率完全没变,4K分辨率下帧率倒是提升了4%。
4、孤岛惊魂5
这个游戏开启SAM后没有任何影响。
5、古墓丽影:暗影
在《古墓丽影:暗影》中,开启SAM技术之后,3个分辨率下都有明显提升,1080P下提升了3%,2K分辨率下帧率提升了5%,4K分辨率时也有4%的提升。
6、绝地求生
在《绝地求生》中,开启SAM也没有太明显的改善。
7、死亡搁浅
开启SAM技术之后,《死亡搁浅》在4K分辨率下有了4%的提升,其他2个分辨率帧率的差异可以看成是误差。
8、巫师3
《巫师3》中,启用SAM技术之后,3个分辨率下均有1%的帧率提升。
9、战地5
《战地5》中,开启SAM技术带来的性能提升非常显著,特别是2K分辨率下可以一直有200FPS的满帧运行,4K分辨率下的帧率提升也达到了5%。
10、战争机器5
《战争机器5》是我们测试的游戏中,开启SAM技术后受益最大的。在1080P分辨率下提升幅度达到了12%,2K分辨率下也有8%的提升,4K分辨率的提升是4%。
首先注意一点,锐龙95900X的游戏性能比i9-10900K稍有不如是因为后者超频到了全核5.2GHz,而前者是默频状态。
在开启SAM技术之后,2K与4K分辨率下,RX6800XT的帧率都有3%的提升,而此时默频的锐龙95900X的游戏帧率已经超越了超频到5.2GHz的i9-10900K。
1080P分辨率下由于《德军总部:新血脉》的帧率下降了7%,导致开启SAM技术之后整体性能提升只有1%。
十、温度与功耗测试:游戏功耗偏高RX6800烤机仅68度
1、功耗测试
在GCN年代,AMD显卡的功耗一度令人绝望,不过从RDNA构架开始,AMD的独门绝技可以在待机状态下将GPU和显存频率都降到个位数,待机功耗要比同期的NVIDIAGPU低不少。
可以看到在待机状态下,RX6800XT的GPU频率竟然只有0MHz(不知道是否显示错误),显存频率也只有20MHz,GPU待机功耗是6~7W。
我们分别测试待机、游戏以及FurMark的功耗表现,测试所用的电源为XPGCOREREACTOR850GOLD电源。
我们的i9-10900K平台进行了超频,因此其功耗会较默频时高一些。
待机功耗自然是RDNA2构架的2块显卡更低,RX6800与RX6800XT都不到90W,比NVIDIAGPU低5W左右。
在进行FurMark烤机时,RX6800的功耗比RTX2080Ti低30W,比RTX3070高20W。RX6800XT的烤机功耗达到了460W,比RTX3080低5W左右。
不过在运行游戏时,2块RDNA2GPU的功耗都有点偏高,其中RX6800XT竟然比RX3080还要高16W,而RX6800的游戏功耗也超越了RTX2080Ti。
2、温度测试
这里我们只对RX6800/6800XT进行温度测试,测试时室温24度。
Furmark的参数设定为1920*1080分辨率、0AA。运行7分钟之后,RX6800的温度稳定在68度,HotSport温度是90度(这个没到110度都不用怕),运行频率则为2013Hz,GPU功耗203W。
至于RX6800XT,在运行FurMark8分钟之后,温度稳定在74度,HotSport温度是94度,运行频,2039MHz,风扇转速1520RPM。
十一、光线追踪性能测试:RDNA2的效率暂不及安培GPU
NVIDIA的GPU有专门的RTCore,用来计算光线,AMD的实时光线追踪方案与NVIDIA不同,是将RayAccelerator单元集成到了RDNA2的CU之中,每个CU配一个RayAccelerator单元。
由于DXR技术已经被整合到了DIRECTX12之中,因此只要是采用DIRECTX12接口的实时光线追踪游戏,AMD的RDNA2GPU都能在游戏中启用DXR技术。比如《战地5》、《古墓丽影:暗影》、《地铁:离去》、《控制》、《使命召唤16》、《德军总部:新血脉》、《堡垒之夜》、《看门狗:军团》等等游戏RDNA2GPU都支持开启光追。
以下测试均是在4K分辨率下运行,并开启最高画质。
1、堡垒之夜
至于测试场景,为了尽量避免变量干扰,我们选择了嗨皮岛的一个单人场景进行测试。
AMD显卡在堡垒之夜中的表现要强于NVIDIA显卡,RX6800XT开启光线追踪之后,帧率依然有34FPS,而RTX3080只有22FPS。RX6800开启光追之后,帧率几乎是RTX3070的2倍。
2、古墓丽影:暗影
RX6800XT在4K分辨率下开启光线追踪之后,帧率只有42FPS。
RX6800更是只有30FPS。
在《古墓丽影:暗影》中,RX6800XT在开启DXR技术之后,帧率从80FPS掉到了42FPS,下降幅度超过了接近50%;而RX6800则直接从71FPS掉到了30FPS,降幅接近6成。
相比之下,2块NVIDIAGPU表现要好一些,RTX3080开启DXR之后帧率下降了40%,RTX3070同样也是跌了40%。
3、控制
不开启DXR时,RX6800XT的帧率为56FPS。
开启DXR技术之后,地面以及墙壁上产生了非常真实的光影效果,同时画面看上也去更加明亮。不过代价就是帧率跌到了26FPS,下降了一半还多。
2款RDNA2GPU在开启光追技术之后,帧率都下降了50%以上,而2块安培GPU的帧率只下降了40%。
十二、总结:RDNA2只是开始还远未发挥最强的性能
2020年,AMD带给了我们足够多的惊喜!在CPU领域Zen3处理器时隔15年终于从Intel手中抢回了最强游戏处理器的宝座。
而在GPU领域,RDNA2的发布也迫使NIADIA一再改变原有了GPU规划,20GB的RTX3080被取消了,取而代之的是更强的RTX3080Ti。RTX3070Ti也被取消了,因为再怎么折腾也无法战胜RX6800。RTX3070、RTX3060Ti都推迟上市,RTX3060据说更是会有12GB显存,反而高于RTX3080。
作为消费者,真的是很乐意看到这样的竞争!
下面长话短说,将测试结果汇总如下:
1、游戏性能
在任何分辨率下,RX6800都要领先于RTX3070!1080P分辨率下的优势是8%,2K可以领先11%,4K依旧有9%。
RX6800XT在低分辨率下有优势,1080P比RTX3080快4%,2K分辨率时只有1%的优势,到了4K分辨率时被反超了4%。显存带宽还是很重要的!
当然这里说的都是基于Intel平台的测试结论,如果换到AMD平台会有一些差别。
2、SmartAccessMemory(SAM)显存智取技术
前提是必须3A平台,包括AMD500主板、Zen3CPU、RDNA2GPU。
在开启SAM技术之后,RX6800XT在2K和4K分辨率下能够有3%的提升,超过RTX3080已经不是太大的问题!与此同时默频的锐龙95900X的游戏性能超越了超频到全核5.2GHz的i9-10900K。
另外有部分游戏在1080P分辨率下开启SAM技术之后帧率有降低的情况,还需要BIOS与驱动的继续完善,后续SAM技术带来的性能提升会远远不止3%。
3、功耗
待机功耗很低,烤机功耗正常,游戏功耗偏高。
在运行游戏时,TDP300W的RX6800XT的整机功耗比320WTDP的RTX3080还要高20W左右,RTX3070的功耗也比RTX2080Ti高6-10W。
4、超频
RTX3080的超频能力简直就是一言难尽,本身的加速频率并没有多高,40MHz的超频幅度简直连鸡肋都算不上。
RX6800的默认加速频率2105MHz,实际运行频率可以达到2250MHz,超频则能上2500MHz,超频后性能提升10%以上。
RX6800XT默认加速频率2250MHz,实际运行频率可以达到2450MHz,超频之后可以到2650MHz。
在频率方面,新一代的RDNA2GPU对NVIDIA的AmpereGPU简直就是碾压性的优势。由于频率可控空间更大,RX6800/6800XT的非公版也非常值得期待。
5、光线追踪
RDNA2支持硬件加速光追,不是软件模拟。总的来说目前RDNA2GPU中的RayAccelerator单元的效率暂时不及N卡的RTCore,但是差距并不大。当初NVIDIA的RTX技术在发布之初同样也是断崖式的帧率降低,经过了2年多的优化才有现在的成果。
相信经过后续的优化,RayAccelerator单元的效能会有改善。
6、FidelityFX超分辨率抗锯齿技术
RNDA2不支持DLSS有点遗憾,不过AMD也在开发类似的技术--FidelityFX超分辨率抗锯齿!这个功能目前正在开发中,不久之后会在新驱动中提供支持,敬请期待!