NVIDIAGeForceRTX2080与RTX2080Ti测试报告Turing世代光追,AI游戏未来

导读 NVIDIA 暌违 2 年之久的游戏卡新架构「Turing」登场,一举发表三款 GeForce 游戏卡 RTX 2070、RX 2080 与 RTX 2080 Ti,分别


NVIDIA 暌违 2 年之久的游戏卡新架构「Turing」登场,一举发表三款 GeForce 游戏卡 RTX 2070、RX 2080 与 RTX 2080 Ti,分别使用 TU102 与 TU104 GPU,这代强化 GPC 架构下的 SM 核心,并导入 RT Core 与 Tensor Core 硬体加速核心,分别加速即时光线追蹤与深度学习运算。究竟这一代的更新,可提升多少 DirectX 11 游戏的性能?更是玩家所重视,本篇章除创始版显卡开箱外,更介绍这一代 Turing 架构的创新与改变,以及 AAA 大作的性能测试。


光追、AI 游戏未来「Turing」TU102 / TU104 / TU106 GPU

NVIDIA Turing 世代,不仅製程升级至 12nm FFN,架构上亦改变「Streaming Multiprocessor (SM)」设计,加入独立的 INT 与 FP 运算单元,并提升 L1 与 L2 快取性能,让这一代 CUDA 核心性能比起上一代有着近 50% 的性能提升。

此外,SM 单元内更加入「RT Core」与「Tensor Core」硬体加速单元,藉由专属硬体设计,加速 Real-Time Ray Tracing 与 Deep Learning 游戏应用,让 GeForce RTX 游戏显卡走向「混合渲染」的新领域。

这一代 Turing 架构,最完整的 GPU 核心代号为「TU102」,亦是GeForce RTX 2080 Ti 与 Quadro RTX 6000 所使用的 GPU。

TU102 GPU 包含着 6 组 Graphics Processing Clusters(GPCs)与 72 组 Streaming Multiprocessors(SMs)所组成。而每一组 GPC 当中有着 6 组 TPC 单元,在每组 TPC 之下各有 2 组 SM单元。每一组 SM 包含着 64 CUDA 核心、8 Tensor 核心、256KB 暂存器堆、4 组 Texture Units 与 96KB L1/shared Memory。

至于负责 Ray Tracing 的 RT Core,则是存在每一组 SM 单元之中;简单来说,完整的 NVIDIA Turing 世代 TU102 有着以下几个特点:

4,608 CUDA Cores72 RT Cores576 Tensor Cores288 texture units12 32-bit GDDR6 memory controllers (384-bits total)



↑ NVIDIA Turing TU102 架构。


大架构来看,Turing 世代除了 12nm FFN 的製程升级,不仅提升 SM 单元性能与加速快取,更加入 RT Core 与 Tensor Core 硬体加速单元。接着细看 SM 单元内,有着共 64 组 INT32 与 64 组 FP32 核心,以及 8 组 Tensor Core、1 组 RT Core。

一组 SM 单元可分为 4 个处理区块,每区块有着 Warp Scheduler 与 Dispatch 单元,因此每一区块皆可各自进行平行运算,并具备 L0 指令快取、64KB 暂存器堆;4 个处理区块共同分享 96KB L1 Data Cache/Shared Memory。


↑ SM 单元架构。


此架构设计的改变,无疑就是为了走向「混合渲染」,在一个 Turing Frame 的时间下,可分别调用 FP32 Shading、Ray Traging、INT32 Shading 与 Deep Neural Network library(DNN)混合运算,让游戏渲染可获得更高的性能与运算能力,达到更为真实的游戏体验。


↑ Turing 所强调的混合运算能力。


But,GeForce RTX 2080 Ti 虽使用 TU102 GPU,但为了与 Quadro RTX 6000 绘图卡区隔,因此删减了 2 组 TPC 也就是屏蔽 4 组 SM 单元,因此 RTX 2080 Ti 的 CUDA 核心数为 4352,相对的 RT Core 与 Tensor Core 也有所不同,下表提供给各位玩家参考。


↑ RTX 2080 Ti、RTX 2080 与 RTX 2070 规格表。


而 RTX 2080 所使用的 TU104,同样有着 6 组 GPC,但每组 GPC 之中仅有着 8 组 SM,因此共有着 2944 CUDA、368 Tensor Core、46 RT Core,并配置 8GB GDDR6 记忆体。


↑ TU104 架构图。


最后 RTX 2070 使用 TU106 GPU,仅有着 3 组 GPC,而每组 GPU 维持着 12 组 SM,因此有着 2304 CUDA、288 Tensor Core、36 RT Core,同样配置 8GB GDDR6 记忆体。


↑ TU106 架构图。


Turing「RT Core」硬体加速 Real-Time Ray Tracing

Real-Time Ray Tracing 无疑是这一代的一大重点,重要到取代了 GeForce GTX 命名,新一代具备 RT Core 的产品,都以 RTX 来命名,而「光线追蹤」技术早已行之有年,但 GPU 在计算光线追蹤时,不仅效率低性能较慢,无法满足游戏所需的 60fps 之性能。

因此,NVIDIA 在 Turing 架构中,设计用来加速光线追蹤的「RT Core」核心,RT Core 针对「Bounding Volume Hierarchy(BVH)」演算法进行加速,将需要计算光线追蹤的物件,以 Bounding Volume 切出许多区块,并逐步缩小 Bounding Volume,直到趋近于计算光影的位置。


↑ Bounding Volume Hierarchy。


由于 RT Core 是独立运算单元,因此可将光线追蹤的工作挪出主要 Shader,让 Shader 可继续渲染,而光线追蹤则由 RT Core 负责处理。


↑ RT Core 独立运算光线追蹤。


虽然 NVIDIA 发表时提到,将来有多款游戏支援 Real-Time Ray Tracing,但就目前测试时间点来说,作业系统与游戏尚未支援,因此 NVIDIA 仅提供「Star Wars Reflections」展示。

笔者分别使用 RTX 2080 Ti 与 GTX 1080 Ti 来运行这 4K DLSS Star Wars Reflections 展示,在暴风兵与全身金属反射的军团长官搭乘电梯时,RTX 2080 Ti 运行 3840x2160 DLSS 时有着 30.85fps、32.41ms 的性能,而相较于 GTX 1080 Ti 则只能跑 2560x1440 解析度时 7.74fps、129.20ms 的性能。

由此可见,具备 RT Core 与 Tensor Core 的新一代 RTX-20 系列显示卡,可给予玩家更强悍的混合运算性能。(原图下载)


↑ RTX 2080 Ti 运行 3840x2160 DLSS 性能 30.85fps、32.41ms。


↑ GTX 1080 Ti 运行 2560x1440性能 7.74fps、129.20ms。


Turing「Tensor Core」硬体加速 Deep Learning 游戏应用

Deep Learning 深度运算是目前最接近 AI 人工智慧的技术,亦是目前 NVIDIA 相当重视的 GPU 应用领域。Turing 随着 Volta GV100 的脚步,于 GPU 内加入「Tensor Core」核心,并支援 INT8、INT4 与 FP16 等不同精度的计算。

Tensor Core 核心以硬体方式加速深度学习,在训练(Training) Neural Network 与推理(Inferencing)时所需要的 Matrix Multiplication 计算。


↑ 独立的 Tensor Core 核心可更快速运算 Neural Network 的推理。


当然 NVIDIA 并非只设计硬体,针对 Deep Learning 的技术应用,NVIDIA 提供一套 NGX(Neural Graphics Acceleration)技术,由 NVIDIA 自行训练的 Deep Neural Networks(DNNs),可利用 AI 来加速绘图、渲染等应用。

游戏开发商或开发者,可运用 NVIDIA NGX 所提供的 API,像是 AI Super REZ、AI SLOW-MO、AI INPAINTING 与 NVIDIA DLSS 等功能应用,都可透过 NVIDIA GeForce Experience 进行更新与调用。


↑ AI INPAINTING 即是智慧影像填补,可将图中的杂物、路人删去,并由 AI 来计算填补的影像。


↑ AI SLOW-MO 即是让一般 60fps 的影片,藉由 AI 来补帧达到 240fps、480fps 的慢动作影片。


↑ AI Super REZ 则透过 AI 来强化影像画质。


其中 NVIDIA 主打的 Deep Learning 游戏应用莫过于「DLSS(Deep Learning Super-Sampling)」,藉由深度学习的方式,让 AI 来自动计算游戏的超级採样反锯齿技术。

换句话说,以往游戏渲染的影像,通过 Temporal Anti-Aliasing(TAA)计算影像反锯齿,最终可获得边缘平顺的高质感影像,但也大幅佔用 GPU 资源,使得游戏性能的下降。

而 DLSS 的游戏开发相当特别,游戏厂商需将游戏世界的素材、影像,以及高质量的反锯齿素材,交给 NVIDIA 的超级电脑,由 NVIDIA 来训练 Deep Neural Network(DNN),当游戏开发(训练)完成后,玩家在执行游戏时则将反锯齿交由 Tensor Core 处理验证,如此一来可获得更好的游戏性能,以及出色的反锯齿画质。

只不过,目前支援 DLSS 的游戏尚未更新,NVIDIA 则提供「Final Fantasy XV Benchmark」测试。当游戏运行在 3840x2160 的 4K 解析度时,倘若一般 TAA 反锯齿技术,会让整体性能压在不到 60fps,但藉由 DLSS 进行超採样反锯齿时,不仅可让性能得以提升,并得到近似于 TAA 反锯齿的效果。

但若放大仔细看会发现,DLSS 有些地方计算的比 TAA 好,但有些地方因为 DLSS 训练的素材不足,导致结果比 TAA 模糊的问题。这也可印证,DLSS 可以获得更好的性能,但整体的画质取决于前期的 Deep Neural Network(DNN)训练素材是否足够。(原图下载)


↑ Final Fantasy XV Benchmark DLSS 与 TAA 比较图。


↑ DLSS 于丁子裤的带子上,有着相当好的反锯齿效果。


↑ TAA 在丁子裤的带子上,则有着锯齿状。


↑ DLSS 在车牌验证上,由于文字是单一且独特,若没训练车牌或文字的 DNN,所以车牌下方的文字相当模糊。


↑ TAA 在车牌计算上则相对清楚。


进阶绘图 Mesh Shading、Variable Rate Shading (VRS)

这一代的更新 NVIDIA 加入相当多的功能,都为了提升整体的绘图效能,就像是「Mesh Shading」。当游戏世界的「物件」数提升时,很容易导致 GPU 性能的下降,这在 MMO 或打宝游戏常遇到,物件、敌人、玩家挤在同一个区域时,很容易造成性能的骤降。

因此 NVIDIA 提出的「Mesh Shading」,不像以往物件由 CPU 递交 Draw Call 给 GPU 的方式,Mesh Shading 可让开发者将物件清单交给 GPU 平行运算,并由 Mesh Shader 依据物件不同的 Levels of Detail(LOD)等级进行细节的渲染。

从 NVIDIA 提供的 Asteroids Demo 展示,画面中有着数以万计的小行星,若每一个都用最高 LOD 进行渲染,则会导致效能不足,且距离游戏视窗越远的物件,其实难以分辨其细节,因此透过 Mesh Shading 针对不同 LOD 的物件进行渲染,即可兼顾画质与性能的平衡。


↑ Asteroids Demo 3840x2160,画面中有着 27 万颗小行星,透过动态 LOD 给予不同的细节等级,画面中黑色是细节最高,如此一来可让画面丰富但亦保有性能。


↑ 不同的物件 LOD 决定物件最终的细节。


而「Variable Rate Shading」则可让开发者依据不同的层级来进行影像的渲染,例如赛车游戏画面中,赛车的车身、远景,必须要丰富的细节採用 1x1 来渲染,而因为动态模糊关係,使得马路、四周景物较难分辨细节,则可採用 2x2、4x4 的方式来进行渲染。

这渲染方式亦可让游戏有更好的性能,更可应用在 Content Adaptive Shading、Motion Adaptive Shading、Foveated Rendering 等情境。


↑ Variable Rate Shading。


8K30 编码 HEVC 支援与 VirtualLink

NVIDIA GeForce RTX-20 系列,支援 8K60 HDR 的影像输出,以及 VirtualLink Type C 介面。单一组 VirtualLink 介面,及包含着:4 lanes HBR3 DisplayPort 影音输出、USB 3.1 Gen2 SuperSpeed 资料传输、27W 电源供电。

也就是说 1 组 VirtualLink C,即可用来连接 VR 头盔所需的影像、资料与供电,让 VR 体验更便利;而且未来萤幕亦可以 Type C 方式来连接影像与供电。


↑ 8K60 HDR 输出与 VirtualLink。


影像编解码方面,则支援 HEVC 8K30 HDR 即时编码、HEVC 与 H.264 编码的性能提升,解码则支援 VP9 10/12b HDR 与 HEVC 444 10/12b HDR。


↑ 影音编码支援。


创始版 NVIDIA GeForce RTX 2080 与 RTX 2080 Ti 超频显示卡开箱

首波开箱的 NVIDIA GeForce RTX 2080 与 RTX 2080 Ti 创始版,这代卖的不仅只是信仰,更是已经超频后的性能,这也是 NVIDIA 少见採用双扇、均热板散热设计,因此显卡厚度维持在 2 slot,但 GPU 时脉已预先超频。

详细的规格不再赘述,创始版规格主要在超频时脉与 TDP 比标準高,其余规格则相同。

这代显示卡外盒有着相当漂亮的彩盒,打开后显卡则立于盒内,并写着:「INSPIRED BY GAMERS. BULIT BY NVIDIA.」。显示卡配件盒中,则有着两本说明与支援文件,以及一条 DisplayPort 转 DVI 线材。


↑ 创始版 NVIDIA GeForce RTX 2080 与 RTX 2080 Ti 外箱。


↑ 採用直立显卡的包装设计。


↑ INSPIRED BY GAMERS. BULIT BY NVIDIA.。


↑ 配件盒。


这代外观上不像 GTX-10 系列那么多的立体三角造型,而是简洁俐落的点线面,对称呼应着双扇的设计,亦因为主推 Ray Tracing 的关係,创始版外观的金属材质,依据不同的光线呈现出不同的面貌。


↑ RTX 2080 与 RTX 2080 Ti 创始版。


↑ 对称的双扇设计,以及高质感的金属外壳。


显示卡上方侧面与下方有着对称设计,上侧中央有着 GEFORCE RTX 字样,为开机时是溅镀的镜面,而开机后则会亮起 NVIDIA 的信仰绿灯。

RTX 2080 创始版採用 6+8pin 供电,而 RTX 2080 Ti 则是 8+8pin 供电设计。


↑ 侧面有着 GEFORCE RTX 字样。


↑ RTX 2080 6+8pin、RTX 2080 Ti 8+8pin。


显卡的 NVLink 金手指,有着专属的防尘盖,若要使用 NVLink 桥接器,仅需将盖子移除即可安装。


↑ NVLink 金手指与防尘盖。


↑ 显卡下方侧面也有着对称设计。


↑ 显卡前端则有 NVIDIA 的 Logo。


↑ 显卡背面则是银色背板。


创始版维持着标準卡的长与宽,显卡长度维持在 27cm,厚度则是保持在 2 slot 约 4cm 的厚度。创始版亦是目前少数超频卡,能够保持在标準 2 slot 厚度内的设计,这也意味着新版散热,在厚度不变改为双扇设计下,即可带来更好的散热性能。


↑ 显卡长度 27cm。


↑ 显卡厚度 2 slot、4cm 左右。


显示输出,创始版则提供 1 组 VirtualLink C、3 组 DisplayPort 1.4a 与 1 组 HDMI 2.0b HDCP 2.2。

因此最高可达到 DisplayPort 8K60Hz 输出,而 HDMI 最高 4K60Hz 输出。


↑ 显示卡输出介面。


创始版的拆解老实说:「螺丝、铜柱非常的多。」,也因此整体显卡的结构强度相当高。拆除散热器之后,即可见到 RTX 2080 的 GPU。

RTX 2080 採用 TU104-400A-A1 GPU,并配置 8 颗 Micron GDDR6 记忆体,供电则採用 8+2 相 iMON DrMOS 设计,GPU 8 相、记忆体 2 相。


↑ RTX 2080 创始版拆解,散热器、电路板与金属背板。


↑ TU104-400A-A1 GPU。


↑ 10 相供电设计。


↑ RTX 2080 电路板背面。


RTX 2080 Ti 创始版设计相同,只不过 TU102-300A-K1-A1 GPU 面积比起 TU104 还要大上许多,周围则配置 11 颗 Micron GDDR6 记忆体,并採用 13+3 相 iMON DrMOS 供电设计,GPU 13 相、记忆体 3 相。


↑ RTX 2080 Ti 创始版拆解。


↑ TU102-300A-K1-A1 GPU。


↑ 左侧的 6 相供电。


↑ 右侧 10 相供电。


↑ RTX 2080 Ti 电路板背面。


创始版的 RTX 2080 与 RTX 2080 Ti 开机后,上方侧面的 GEFORCE RTX 会亮起绿色信仰灯,让玩家可感受 NVIDIA 的魅力。


↑ 信仰灯 GEFORCE RTX。


GPU BOOST 4.0 与 NVIDIA SCANNER

自 NVIDIA GTX-10 代以来,GPU 只要在更低的温度与更多功耗的情况下,可藉由 GPU Boost 3.0自动超频,让 GPU 时脉超过规格的 Boost 时脉。GPU Boost 3.0 的运作犹如下图所示,在电源与温度的限制下,尽可能的提高时脉。


↑ GPU Boost 3.0。


至于 GPU Boost 4.0 则允许玩家自行控制温度的节点,也就是说玩家可透过软体,如 EVGA PrecisionX1 或 MSI Afterburner 软体来控制,调整 GPU Boost 4.0 的温度节点,例如将节点全部拉到 T2 温度点,即可获得更高的性能,但相对的 GPU 温度也会跟着提升。


↑ GPU Boost 4.0 玩家可透过软体调整自动超频的温度节点。


↑ 透过 PrecisionX1 软体调整温度控制点。


此外,NVIDIA 可量到并非所有玩家都熟悉显示卡的超频,因此推出 NVIDIA Scanner 功能,玩家在扫描前可先调整 Power Target 与 GPU Temp Target,而 Scanner 会依据不同的 GPU 电压,来测试 GPU 时脉与温度的表现,让玩家在简易调整电源目标与温度目标后,确保显卡能稳定运作。


↑ NVIDIA Scanner 功能,调整 Power Target 与 GPU Temp Target 后,透过 Scanner 进行不同电压下的时脉测试。


GeForce RTX 2080 与 RTX 2080 Ti 性能测试

这一代 Turing 加入许多新游戏功能,但现阶段主流 AAA 游戏还是以 DirectX 11 为大宗,而 DirectX 12 或 Vulkan API 则相对少,因此不少玩家好奇这一代 RTX 2080 与 RTX 2080 Ti,比起上一代 GTX 1080 与 GTX 1080 Ti 的性能有多少提升?


↑ 本次测试平台规格。


GPU-Z 已可检视 RTX 2080 与 RTX 2080 Ti 完整资讯。GPU 核心代号为 TU104 与 TU102,两者详细的资讯请参考下图。


↑ RTX 2080 GPU-Z 资讯。


↑ RTX 2080 Ti GPU-Z 资讯。


3DMark Fire Strike 可快速衡量平台的游戏绘图效能,亦是目前显示卡最常使用的测试软体。Fire Strike 锁定 AAA 等级 DX11 API 的高效能测试,在预设 1080p 解析度 Fire Strike 测试中,RTX 2080 获得 22,995 分,其成绩与上一代 GTX 1080 Ti 相近;而 RTX 2080 Ti 则来到 26,836 分。

接着在 1440p 的 Extreme 测试下,RTX 2080 Ti 获得15,671 的高分,但是 RTX 2080 反而小输于 GTX 1080 Ti,但大赢同位阶的 GTX 1080。在 2160p Ultra 测试情况相同,RTX 2080 Ti 获得8,161 的高分,但同样 RTX 2080 小输于 GTX 1080 Ti,但比起同位阶的 GTX 1080 还要强。


↑ 3DMark Fire Strike,越高越好。


3DMark Time Spy 则是採用新的 DirectX 12 API 所设计的测试软体。在 1080p 的 Time Spy 测试上,RTX 2080 获得 10,192 分,皆赢过上一代 GTX 1080 Ti 与 GTX 1080,而 RTX 2080 Ti 则获得 12,542 的高分。

至于更高解析度的 Extreme 测试,则有着相同的性能区间。可见这一代,RTX-20 系列在 DirectX 12 性能有所提升,但在 DirectX 11 API 下仅能靠 SM、CUDA 数量与时脉来提升性能。


↑ 3DMark Time Spy,越高越好。


VRMark 可用来衡量电脑是否有足够的性能驱动 VR 虚拟实境,并有着 Orange Room、Blue Room 与 Cyan Room 三个测试场景。

Orange Room 属于基準测试,用来衡量电脑是否能够匹配 HTC Vive 与 Oculus Rift 的 VR 设备,在这情境下四张测试显卡,分数都达到 11,000 分的等级,也就是这项目单卡顶天就这分数了。

而 Blue Romm 测试更为严苛,採用 5120 × 2880 解析度与大量的积体照明,要求极高的硬体性能,这测试之下 RTX 2080 Ti 获得 4,529 分、RTX 2080 获得 3,508,比起上一代的 GTX 1080 与 GTX 1080 Ti 有着明显提升。

至于採用 DirectX 12 设计的 Cyan Room,更有飞越性提升,RTX 2080 Ti 获得 13,755 分、RTX 2080 亦有 11,027 的成绩,可见这代 DirectX 12 性能有着大幅的提升。


↑ VRMark,越高越好。


UNIGINE 系列採用自家游戏引擎打造的测试软体。2009 年推出的 UNIGINE Heaven,採用第一代引擎开发,支持 DirectX 9 / 11 与 OpenGL 4.0 等 API,而在 Extreme 设定下 RTX 2080 平均 178fps 与 GTX 1080 Ti 相近,而 RTX 2080 Ti 则飙到平均 217fps。

接着 2013 年推出的 UNIGINE Valley 採用相同 Heaven 的引擎,但测试场景来到森林当中,有着更丰富的细节与场景,同样在 Extreme HD 设定下 RTX 2080 平均 133fps,输给 GTX 1080 Ti,而 RTX 2080 Ti 则有平均 163.6fps 的性能。

最新 2017 年推出的 Superposition,採用 UNIGINE 2 Engine 开发,有着更高的性能测试并支持 VR,在使用 1080p Extreme 测试下 RTX 2080 平均 49.2fps、RTX 2080 Ti 平均 62fps,皆赢过比较的 GTX-10 系列产品。

简单来说,旧款 DX11 游戏还是靠 SM、CUDA 与时脉来冲性能,因此旧的 Heaven 与 Valley 用 RTX 2080 Ti 来跑有着更高的性能。但是 RTX 2080 虽然是新一代架构,但其 CUDA 核心数量是低于 GTX 1080 Ti,因此才会显得 RTX 2080 性能与 GTX 1080 Ti 相近,但就两卡的等级来说,这并非同级产品。

虽说 Superposition 也是採用 DX11,但这测试就能感受到新一代 RTX-20 系列更强悍的性能。


↑ UNIGINE Benchmark,越高越好。


GeForce RTX 2080 与 RTX 2080 Ti 游戏测试

就 3DMark 测试分数来看,RTX 2080 性能比起 GTX 1080 有着约 30% 左右的性能提升,若是 DirectX 12 则有着近 45% 的性能提升;而 RTX 2080 Ti 与 GTX 1080 Ti 相比,则在 20% 性能的提升,DirectX 12 则有到 35%。

但还是要实际游戏 fps 的测试才能贴近玩家游玩游戏时的性能表现。此次,游戏挑选几款近期 AAA 大作,像是美女冒险的《古墓奇兵:暗影》,以及首次登入 PC 的 CAPCOM 大作《魔物猎人:世界》,在开放世界探索、冒险与狩猎;除了新游戏之外,亦有几款固定测试班底,像是《斗阵特攻》、《绝地求生 PUBG》、《极地战嚎 5》与《刺客教条:起源》等,透过这 6 款游戏来检视 RTX 2080 与 RTX 2080 Ti 的性能表现。

游戏测试皆以「预设最高设定」为测试基準,并比较主流 1080p(1920 x 1080)解析度与 4K 2160p(3840 x 2160)解析度进行测试。

首先面对主流 1920x1080 解析度的 1080p 游戏,RTX 2080 与 RTX 2080 Ti 毫无压力,几乎可达到平均 100fps 以上的表现。而且在部分游戏 RTX 2080 性能就可赢过 GTX 1080 Ti,更比 GTX 1080 更适合做为玩胜 1080p 的显卡。


↑ 1080p 游戏测试,越高越好。


主战场的 3840x2160 解析度的 4K 2160p 游戏,面对 AAA 大作特效全开,RTX 2080 Ti 可撑住平均 60fps 的性能底线,只不过《魔物猎人:世界》这款要求甚高,因此平均仅只有 41fps。

至于 RTX 2080 在 4K 性能,相当接近上代卡王 GTX 1080 Ti,若追求 4K60 的玩家,笔者还是推荐 RTX 2080 Ti。而 RTX 2080 则向下满足 2K 1440p、1080p 特效全开 AAA 大作的性能需求。

当然目前游戏测试,还未跟上 Ray Tracing 或 DLSS 新技术,亦无法让新一代 RTX-20 系列显示卡大展身手,各位要冲一波吗?


↑ 2160p 游戏测试,越高越好。


GeForce RTX 2080 与 RTX 2080 Ti 功耗测试

这一代创始版,不仅摒弃单鼓风扇设计,改以双扇与大面积均热板散热器,让 RTX 2080 与 RTX 2080 Ti 创始版出厂已超频,这一代创始版不仅象徵着 NVIDIA 信仰,更强调创始版是有足够的性能,而非用来比较性能的基準。

RTX 2080 与 RTX 2080 Ti 待机时,GPU 温度仅 35°C、40°C,通过 Fire Strike Stress test 与 FurMark 1080p, 4XMASS 进行测试,RTX 2080 GPU 温度来到 74°C、RTX 2080 Ti GPU 温度 78°C,比起上一代飙至 82°C 的温度来看,确实这代散热有更好的性能,况且即便烧机下风扇也相当安静。


↑ GPU 温度测试,越低越好。


功耗方面,待机时 RTX 2080 与 RTX 2080 Ti 整机功耗约在 90W 左右,而压力测试下 Fire Strike Stress test 整机功耗来到 RTX 2080 / 343W、RTX 2080 Ti / 395W;至于 FurMark 最高功耗则在 330W、355W。

由于 Fire Strike Stress test 的 CPU 使用率比 FurMark 高的关係,在 Intel Core i7-8700K 的平台上测试,这功耗差异是可预期。由于核心数的提升与高时脉,让 RTX-20 系列的功耗在往上提升,但也对的起他的效能。


↑ 整机功耗测试。


总结

新一代 GeForce RTX 2080 与 RTX 2080 Ti,不仅改变核心 SM 设计,加入独立的 INT 与 FP 运算单元,以及 RT Core 与 Tensor Core 硬体加速单元,让这一代更符合混合渲染、运算需求,给予玩家更强悍的次世代性能。

这代 GPU 不仅製程提升、CUDA 核心在往上推叠,更具备光线追蹤 RT Core 与深度学习 Tensor Core,面对即时光追、DLSS 等应用,这代性能更远高于上一代,只不过目前测试时,宣布支援的游戏皆未準备好,因此无法在这时间点,就对这一代 GPU 做出结论。


↑ 这不就是玩家期待的游戏光线吗?


NVIDIA 无疑是希望用硬体、用技术,推动游戏产业走向更先进的渲染技术,这代 RTX-20 卖点不外乎即是「4K60」与「游戏未来」。

就 4K60 这点 RTX 2080 Ti 算是在主流 DirectX 11 大作游戏测试下算是及格了;但就 RTX 2080 来说还是有点勉强,而 RTX 2080 更适合 1440p、1080p 解析度下特效全开。

至于游戏未来,不外乎更逼真的光线追蹤、照明与阴影的呈现,以及运用 Deep Neural Network(DNN) 训练 DLSS、慢动作补帧、高解析度等技术,未来游戏就像电影一样,各位在脑中试想想:「我们再操控萝拉·卡芙特进行探险时,可以在惊险、刺激的场面时,透过 AI SLOW-MO 来即时 480fps 慢动作的过场画面。」。

皆下来就期待支援 Ray Tracing、DLSS 技术的游戏推出,我们在来测一遍 RTX-20 系列的游戏未来性能;而这一代创始版,採用新的散热设计与出厂超频,不外乎是要让玩家知晓:「朕卖的不只是信仰,更是技术标竿。」。


↑ 千万别在等电梯的时候 Small talk 阿!


至于价格方面,RTX 2080 创始版 $799 美金、RTX 2080 Ti 创始版来到 $1,199 美金,确实比上一代 GTX-10 系列刚发表的价格高了许多,但这也是性能、技术堆叠下的必然。(若性能提升卖一样的价钱不就是 NVIDIA 慈善佛堂了吗!)。

若各位玩家追的是 4K60,那 RTX 2080 Ti 毋庸置疑,若各为期待的是未来游戏技术,做为务实玩家,可以留待大作游戏推出之时,在来决定是否要升级,毕竟 GTX-10 系列性能,还是可满足大部分 1080p 的玩家需求。


↑ NVIDIA GeForce RTX-20 系列价格与时程(2080 Ti 出货会延一个礼拜)。


4K60 心愿已了,接着光追、AI 游戏未来,NVIDIA 再次提升游戏显卡效能,更追逐游戏未来新技术,这一代不仅只是信仰更是你对未来的投资。

来源: NVIDIA GeForce RTX 2080 与 RTX 2080 Ti 测试报告 /Turing 世代光追, AI 游戏未来

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢