图灵反击 英伟达RTX 2070 Super/RTX 2060 Super首测

这半年的PC领域一点都不太平。AMD分别用第三代锐龙,NAVI显卡再次向英特尔、英伟达发起冲击,并在

这半年的PC领域一点都不太平。AMD分别用第三代锐龙,NAVI显卡再次向英特尔、英伟达发起冲击,并在E3 2019上正式发布RX 5700和RX 5700 XT两款新显卡。有意思的是,在AMD新显卡发布两周前,英伟达就悄然发布了Super字样Logo,英伟达GeForce RTX Super系列浮出水面。

与英伟达以往的命名规则不同,Super将接替以Ti的位置,成为同型号显卡中的进阶产品。名为Super的显卡是否会像Ti那般给人带来惊喜?现在,就让我们奉上英伟达GeForce RTX 2070 Super与GeForce RTX 2060 Super首发评测。

GPU再进阶

为了应付不同价位段,英伟达图灵架构面向消费类的GPU分成了TU102、TU104、TU106三个型号,分别对应GeForce RTX 2080 Ti、GeForce RTX 2080和GeForce RTX 2070,然后再根据市场细分和定位,再对相应GPU部分核心进行屏蔽。例如GeForce RTX 2060就是在完整TU106的基础上,删掉了6个StreamingMultiprocesor(流式多处理器,SM)、6个RT Core、48个Tensor Core,最终完成与GeForce RTX 2070之间的区分。

到了Super系列,局面发生了一些不同,由于TU106已经到顶,GeForce RTX 2070 Super直接进阶到了与GeForce RTX 2080相同的TU104 GPU,型号名称为TU104-410-A1。同时GeForce RTX 2060 Super参数更接近GeForce RTX 2070,型号名称为TU106-410-A1。顺带一提,GeForce RTX 2080与GeForce RTX 2070 GPU型号分别是TU104-400A-A1和TU106-400A-A1。为了让大家能够更清楚英伟达GeForce RTX 2070 Super与GeForce RTX 2060 Super的定位,我们将表格更新如下。

在细节上,TU104 GPU中一共有6个GPC(图形处理簇),每个GPC里包含有4个TPC(纹理处理簇),每个TPC里有2个StreamingMultiprocesor(流式多处理器,SM,对应OpenCL中的概念就是CU,Computing Unit),每个SM里包括若64个CUDA Core。

在结构上,英伟达GeForce RTX 2070 Super以完整的TU104为基础,删掉1个GPC,亦或者根据情况选择4个SM进行屏蔽,最终获得5个或者6个GPC,20个TPC,40个SM以及2560个Cuda Core、320个Tensor Core和40个RT Core。

重点还在于TU104集成单通道NVLink 2.0高速总线,可提供各向25GB/s带宽,远高于HB SLi的1.95GB/s。从外形上看GeForce RTX 2070 Super更长,并配备NVLink接口,提供多显卡玩法,这一举措相当感人。

完整的TU106 GPU一共有3个GPC,每个GPC包含6个TPC,每个TPC内包含2个SM,每个SM有64个CUDA Core。

因此英伟达GeForce RTX 2060 Super以完整TU106为基础,删掉1个TPC。也就是3个GPC、17个TPC和34个SM。因此也获得了2176个CUDA Core,272个Tensor Core和34个RT Core。

由于在图灵架构中引入了RT Core和Tensor Core,以帕斯卡架构以前的硬件堆叠来判断显卡的性能有失偏颇。在Windows 10 RS5以后的版本中已经集成了DirectX Ray Tracing(DXR)和Windows ML机器学习,通过软硬结合,在新的模型里可以实现传统的光栅化渲染、光线追踪和人工智能。因此显卡的混合渲染模型性能指标变成了RTX-OPS,即:Tensor Core(FP16):20%,CUDA Core(FP32):80%,RT Core(RTOPS):40%(80% 的一半),INT32:28%(80% 的 35%)。

公式如下:

RTX-OPS = TENSOR * 20% FP32 * 80% RTOPS * 40% INT32 * 28%

虽然官方没有给出GeForce RTX 2070 Super与GeForce RTX 2060 Super的RTX-OPS指标,但通过推算可以得出:

GeForce RTX 2070 Super RTX-OPS = 72 * 20% 9.1 * 80% 70 * 40% 9.1 * 28% = 52.228 RTX-OPS

GeForce RTX 2060 Super RTX-OPS = 57.4 * 20% 7.2 * 80% 60 * 40% 7.2 * 28% = 43.256 RTX-OPS

最终我们获得了一套对比表格,可以看到GeForce RTX 2070 Super与GeForce RTX 2060 Super正好穿在在GeForce RTX 2060、GeForce RTX 2070和GeForce RTX 2080之间,符合Super定位。

基础性能再进一步

老规矩,先让我们奉上测试硬件环境。参与测试的显卡包括GeForce RTX 2070 Super Founders Edition,GeForce RTX 2060 Super Founders Edition。陪跑显卡包括GeForce RTX 2060 Founders Edition与GeForce RTX 2070 Founders Edition。是的,全部均为英伟达原装信仰版本。

由于RTX 20以后系列显卡均使用了双风扇“燃气炉”设计,散热效果比以往单风扇的GTX 10系列更好。不过AIC厂商通常还会在设计中融入三风扇设计,同时会根据定位,在出厂前对显卡进行一定程度超频,FE版本显卡可以作为参考的基准值。

此外,硬件测试平台包括酷睿i9-7920X、ROG Rampage VI Apex X299主板,Apacer Panther DDR4 3000 8GB x4,Plextor M9PeY 512GB PCIe,以及ASUS PA329Q 4K 10bit显示器。确保在硬件周边上不拖后腿。

Benchmark测试环节依然包括了3DMark Fire Strike Ultra、3DMark Fire Strike Extreme、3DMark Time Spy、3DMark Time Spy Extreme,VRMark Cyan Room、VRMark Blue Room。

从分数上看,GeForce RTX 2060 Super相对GeForce RTX 2060有大约17%的提升。GeForce RTX 2070 Super相对GeForce RTX 2070有大约13%的提升。

在数周前的E3 2019上,实时光线追踪在新游戏中不断被提及,包括大伙翘首以盼的《赛博朋克2077》,具备全新光线追踪效果的《控制》,《使命召唤:现代战争》,《DOOM》新作、《德军总部》新作再加上国产《仙剑奇侠传7》、《剑网3》都已经公开了光线追踪演示,大作吃上光线追踪效果不过是时间问题。

为了让更多硬件支持光线追踪效果,英伟达给光线追踪分成了数套方案,包含反射Reflections、二次反射Advanced Reflections、全局光照Global Illumination、阴影Shadows、环境光遮蔽Ambient Occlusion效果。例如,前阵子火热的劳拉姐姐《古墓丽影:暗影》光线追踪采用了阴影效果,《地铁:离乡》则使用了多种光线追踪方案叠加,在性能上也更吃紧。

3DMark为光线追踪测试增加了Port Royal项目,GeForce RTX 2060 Super提升了23%,GeForce RTX 2070 Super提升了11%。

为了证明实时光线追踪效果添加并不困难,英伟达游戏部门还亲自动手,给上古经典游戏《QUAKE II》追加了光线追踪效果,取名《QUAKE II RTX》,在英伟达官方网站就能下载游玩。实际游戏对比中,两块显卡的光线追踪游戏性能提升都在8%左右。

伴随着光线追踪而来的,自然也少补不了深度学习超采样DLSS。很大原因在于实时光线追踪技术对运算量要求苛刻,属于需要数代显卡更新追逐的技术圣杯,期望短期内实现完美的光线追踪效果完全不可能。这时候就需要用上深度学习超采样DLSS。

DLSS本质上是一种程序分析化抗锯齿技术,在结合海量数据之后,可以达到64倍超采样效果,这是传统MSAA、TAA、FXAA都不敢想象的。结合DLSS意味着GPU可以用较少的资源实现高清晰度画面甚至光线追踪效果,但DLSS本身也有很高门槛,就是必须像RTX 20系列以后显卡拥有Tensor Core进行加速。

同样是3DMark的DLSS项目与《最终幻想15》的DLSS测试,两块显卡提升也与性能提升持平,其中GeForce RTX 2060 Super提升更为明显,一部分原因也在于RTX 2060起始帧率较低。

DLSS与光线追踪融合之后,游戏和DEMO的实际提升愈发明显。事实上我们不必担心RTX显卡在开启光线追踪的游戏效果之后会消耗性能至游戏卡顿,只要是能够光线追踪和DLSS,在保证一定效果光线追踪画质下流畅运行游戏完全没有问题。

能愉快游戏吗?

先说结论,能。

大波3A级光线追踪游戏大作还在赶来的路上,现在我们面临最实际的问题是,能否轻松应对现有游戏作品。我们挑选了数款游戏进行对比,同时也包含了即将在国内上线的《最终幻想14 Online》5.0版本的测试DEMO,而游戏则横跨DirecX数个版本,以验证显卡在实际游戏中的表现。

从综合上判断,GeForce RTX 2060 Super相对GeForce RTX 2060提升大约在14%左右,GeForce RTX 2070 Super相对GeForce RTX 2070提升大约在10%左右。实际游戏体验与3DMark测试分数相当。

在图灵架构之后,英伟达再次对图像算法、内存压缩引擎进行更新。例如《孤岛惊魂5》水面模拟效果,会运用FP16来解决不需要高精度的游戏画面特效。这时候GeForce RTX显卡中的Tensor Core会站出来解决类似的问题。

由于SM内的整数运算单元拥有了自己的指令发射端口,使得浮点运算单元和整数运算单元可以并行执行任务。以《古墓丽影:暗影》的范例来看,平均每100条浮点指令,就会伴随38条整数流水指令和62条浮点流水指令。的当两者并行,指令吞吐率就会升高,游戏速度自然得以提升。

此外,图灵架构还引入了灵活的比率可变着色Varable Rate Shading,即VRS,它可以动态调整屏幕上256个区域的着色比率,方便开发人员部署新算法实现以前难以实现的分区精确优化。例如在《极限竞速:地平线3》画面中,左侧代表不同着色比率的色彩示例,右侧代表画面中的不同色块代表了该区域使用的着色比率,只有1×1的部分会被独立着色,剩下部分会根据开发人员选择只渲染4个像素、16个像素或者其他非正方形像素比率。游戏中路面,两侧风景都可以根据需求更改渲染比率,最终达到节省运算资源,确保游戏画面流畅的效果。

针对不同游戏,新技术可以提供内容自适应着色Content Adaptive Sading和运动自适应着色Motion Adaptive两套算法,实现不同情况的区域精确分割。

从这里可以看出,RTX 20系列优势不仅仅在于更大的芯片面积和元件布局,与之匹配更节省资源的无损算法能让显卡拥有更好的表现。但需要注意的是,新技术需要软件和硬件同时支持,随着英伟达Game Ready深入到游戏的不同开发阶段,发布时间距离现在越近的游戏,也越能发挥出显卡性能,有更好的表现。

简单的说,就是买新不买旧。

同时我们也发现,虽然性能有所增加,GeForce RTX 2070 Super与GeForce RTX 2060 Super的功耗并没有显著提升。其中GeForce RTX 2070 Super TDP为215W,GeForce RTX 2060 Super TDP为175W。除了GeForce RTX 2070 Super改用6 8pin供电,GeForce RTX 2060 Super在电源接口上没有变化,仍然维持8pin电源接口。

通过FurMark压力测试,并通过GPU-Z对GPU核心温度检测,几块GeForce RTX显卡都处在一个水平线上。

同时在26摄氏度的室内环境下,两张显卡的表面最高温度主要还是集中在出风口处以及显卡背板上方。

此为GeForce RTX 2060 Super

此为GeForce RTX 2070 Super

让RTX更懂你

时隔一年,英伟达给出的不仅仅是给出代号“Super”的反击答卷,同时也让配套的软件变得人性化和易用。在未来GeForce Experience更新中,英伟达将会融入一套名为FrameView新功能。

在DirectX 11时代,玩家们可以依靠Fraps等帧数读取软件自行检测自己显卡的实际表现。但往后由于DirectX 12不再支持相应操作,不得不转向通过显卡和驱动提供相应接口,以获取真实数据。

虽然众多AIC厂商在提供调试软件的同时,也提供了相应的游戏帧数监测手段,但由于设计风格和思路不同,不同品牌之间上手操作多少有些门槛。即将融入GeForce Experience的FrameView功能延续了GFE的界面风格,并且简单到只有一个界面。只需要设定好快捷键和存放目录。在游戏中就能直接看到游戏平均帧数、丢帧数、GPU功耗,显卡整体功耗等等。

当然,也可以让FrameView记录完游戏全程的帧数,然后通过Excel自行绘制一套酷炫的曲线表格。

而GeForce Experience本身就是一个能够快速提升英伟达显卡体验的工具,除了优化游戏设置,下载驱动。GFE还能根据用户自身需求,自行选择Game Ready驱动或者Studio驱动,前者应付最新的游戏,后者针对创作软件效率和稳定性做出优化。目前GeForce RTX已经能做到为Adobe Creative Cloud优化,最高支持4K直播和视频编辑等操作。

同时针对国内热门的游戏直播,英伟达也与斗鱼进行技术对接,利用图灵架构的硬件编码器NVENC提升推流的画面质量、帧率和游戏性能。甚至,还可以帮助主播在一台机子上完成游戏、推流。

价格战序幕

面对AMD 新显卡即将开卖,英伟达GeForce RTX 2070 Super与GeForce RTX 2060 Super推出多少有些先发制人的意味。并且从定位来看,两款显卡在性能和定价上必将死磕对手。

其中GeForce RTX 2070 Super上升了一个档次,搭载TU104 GPU,配备NVLink 2.0接口,215W TDP对现有升级都不会有太大影响。GeForce RTX 2060 Super性能提升则更明显,更接近于GeForce RTX 2070。

同时,GeForce RTX 2070 Super国行定价为3999元,GeForce RTX 2060 Super国行定价为3199元,相信之后AIC在价格上压低价格。同时,也难免会逼迫原本的GeForce RTX 2070/2060降价,最终促成新一波性价比甜点显卡诞生。

这场好戏才刚刚开始。除了光线追踪和DLSS,英伟达依靠软件和算法为显卡打造了一整套完整的游戏、创作体验,这不是简单的堆叠硬件参数所能做到的事情。同时,也让我们期待起定价5699元的GeForce RTX 2080 Super性能表现,以及对英伟达进入7nm制程以后的畅想。

至少对于玩家而言,竞争之下产生的性价比,一定是很高的。

打开APP阅读更多精彩内容