NVIDIA GeForce RTX 4080 FE 显示卡性能评测

NVIDIA GeForce RTX 4080 FE 显示卡性能评测

NVIDIA 正式发布全新 GeForce RTX 4080 显示卡,採用全新 AD103 绘图核心、升级新一代 Ada Lovelace GPU 微架构,CUDA Core 增加至 9,728 个、第 3 代 RT Core 及第 4 代 Tensor Core、16GB GDDR6X 容量,与上代架构相比光栅化性能提升 2 倍、Ray Tracing 性能提升 4 倍,新卡性能较 RTX 3080 Ti 快 1 倍但功耗降低 10%,官方定价 NT$ 42,990 起,以下将用 GeForce RTX 4080 Founder Edition 与 RTX 3080 Ti 进行测试。

NVIDIA GeForce RTX 4080 系列登场

在 10 月推出 GeForce RTX 4090 之后,NVIDIA 15 日再发布 GeForce RTX 4080 系列,採用全新 Ada Lovelace 微架构,原本这个系列共有 2 个型号,分别是採用 AD103 绘图核心的 RTX 4080 16GB 与採用 AD104 绘图核心的 RTX 4080 12GB,虽然同样叫 RTX 4080 但两者规格与性能差异颇大,被许多网友指责型号混乱,最终 NVIDIA 官方取消了 RTX 4080 12GB 的推出计划,只保留 GeForce RTX 4080 16GB 型号。

与之前的 Ampere GPU 架构相比,NVIDIA Ada Lovelace GPU 在光栅化游戏中的速度提升达 2 倍,在光线追蹤游戏中的速度提升达 4 倍,主要有四大关键创新︰

NVIDIA GeForce RTX 4080 FE 显示卡性能评测

经改良的 Ada Lovelace 架构

GPC 是 NVIDIA GPU 中最顶层的硬体块,所有关键图形处理单元都位于 GPC 中。 Ada Lovelace 每个 GPC 包括 1 个专用的光栅引擎、 2 个光栅操作 (ROP) 分区,每个分区包含 8 个单独的 ROP 单元和 6 个 TPC,每个 TPC 包括 1 个 PolyMorph 引擎和 2 个 SM。

AD102 GPU 中的每个 SM 包含 128 个 CUDA Core、1 个 Ada Lovelace 第三代 RT 核心、4 个 Ada Lovelace 第四代 Tensor 核心、4 个 Texture 纹理单元、 1 个 256 KB 档案暂存器和 128 KB 的 L1/共享记忆体,可根据图形或计算工作负载需求分配成不同的记忆体大小。

Ada Lovelace GPU 的 GPC 框架设计。

与 Ampere GPU 一样,AD102 的 SM 单元分为 4 个分区,每个分区包含 1 个 64 KB 档案暂存器、一个 L0 指令快取、一个 warp 调度程序、一个调度单元、16 个专用于处理 FP32 的 CUDA 核心操作,每个週期最多可处理 16 个 FP32 操作,16 个可以处理 FP32 或 INT32 操作的 CUDA 核心,每个週期 16 个 FP32 操作或每个时钟 16 个 INT32 操作, 4 个加载 / 储存单元,以及执行超越和图形插值指令的特殊功能的 SFU 单元,除了换上第 4 代的 Tensor Core 设计,FP 单元在微架构上并没有太大变动。

与上代 Ampere GPU 相比,Ada Lovelace GPU 的 L2 Cache 进行了彻底改造,完整的 AD103 GPU 拥有高达 65536 KB 的 L2 快取,相比 GA102 中的 6144 KB 提高了 10 倍,所有应用程序都将受益于拥有如此庞大、更高速的 L2 Cache,例如 Ray Tracing 光线追踪当中的路径追踪之类的複杂操作将产生最大的好处,相较 AMD 的 Infinity Cache 作为 L3 Cache 拥有更高效率,能大幅升游戏 Workload 资料命中率,降低读取延迟并减少 GDDR6X 记忆体频宽使用。

此外,AD103 GPU 受惠于 TSMC 4N 製程,在 NVIDIA 工程师与 TSMC 密切合作下令 AD103 包含的 CUDA 核心跟上一代 GA102 差不多,但 Die Size 却缩减少约 39%,拥有高达 459 亿个电晶体较上代多 38%,并且关键路径中使用高速电晶体设计,令 AD103 GPU 时脉可运作于 2.5GHz 甚至更高,并提供了更出色的能耗比,RTX 4080 性能是 RTX 3080 Ti 的 1 倍,但功耗却降低了 10%,如果启用 RT + DLSS 3 技术后,性能提升甚至最高可达 3 倍。

升级第 3 代 Ray Tracing 引擎

Ray Tracing 光线追踪技术是一种密集型渲染技术,可以逼真地模拟场景及物件的光线,即时以物理方式渲染正确的反射、折射、阴影及间接照明效果。过去的 GPU 架构并无法对游戏及图形进行複杂的即时光线追踪处理,NVIDIA 经过过 10 年的研究及开发,终于在上代 GeForce RTX 20 的「Turing」GPU 微架构中加入硬体光线追踪加速引擎 —「RT Cores」,结合 NVIDIA RTX 软体引擎,实现逼真的即时光线场景效果。

到了 GeForce RTX 30 系列的 Ampere GPU 升级了第 2 代的 RT Cores,BVH 遍历与射线三角交测运算能力提升了 2 倍,第 1 代 Turning SM 在 Ray Tracing 运算时不能同时执行 Graphics 或 Compute 运算,到了 Ampere SM 强化了异步运算能力,当执行 Ray Tracing 运算时可同步进行绘图或运算,令 Ray Tracing 的游戏执行效率大大提升。

来到 GeForce RTX 40 的 Ada Lovelace GPU 升级至第 3 代 RT Cores,它的 Triangle Intersection Engine 相较上代快 2 倍的 Ray-Triangle 相交吞吐量,能为游戏场境中添加更多细节,同时有快 2 倍的 Alpha Traversal 处理能力,新增 Opacity Micromap Engine 直接对几何物件进行 alpha 测试,并显着减少基于着色器的 alpha 运算量。

在 Ada Lovelace GPU 之前,当光线扭曲投射到不同程度透明级别的物件时,例如叶子或火焰等杂形状通常使用纹素的 alpha 通道来表示,单个光线运算也可能需要多次着色器调用才能完成,即使光线只是简单地表徵为命中或未命中都需要大量的运算成本。

为了更有效处理此类内容,NVIDIA 工程师在第 3 代 RT Core 中添加了 Opacity Micromap Engine,为非不透明物件产生微三角形的虚拟网格,每个微三角形都具有不透明状态,RT Core 使用该状态直接解析与非透明三角形的光线交叉点,令 Alpha 场景遍历性能大幅提升,性能升幅很大程度取决于使用情况,如果场景出现大量投射在 alpha 测试几何体上的阴影光线时会看到最大的收益。

第 3 代 RT Core 另一个重要提升是添加 Displaced Micro-Mesh Engine,透过将几何结构换置成微网格,利用 LOD 细节层进行光栅化,相较使用传统三角几何光线追蹤处理,不仅拥有更多细节,相较上代 BVH 数据构建速提升了 10 倍, BVH 所需资料容量减少了 20 倍,而且对複杂环境进行光线追踪时,追踪成本缓慢增加,几何增加 100 倍可能只会增加 1 倍追踪时间。

上代 Ampere GPU 可能需要 1024 个三角几何与複杂的 BVH 结构进行的光线追踪,同样的效果透过 Displaced Micro-Mesh Engine,只需要 1 个基础三角形和 1个置换贴图定义及简单的 BVH 结构就能完成,可以在不相应增加处理时间或记忆体消耗的情况下实现丰富度的数量级增加。

Shader Execution Reording 技术

为实现游戏实时光线追踪的逼真渲染,运算时增加了大量的环境中模拟光线运动,同时亦意味着 GPU 原始处理工作量变得越来越不连贯。例如,用于反射、间接照明和半透明效果的二次光线往往会射入,不同的方向并击中不同的材质,导致二次击中着色器的有序性和效率较低,不规律性的运算会导致 GPU 的处理单元 SM 的低效使用,因此 NVIDIA 在 Ada Lovelace GPU 架构中加入 Shader Execution Reording 着色器执行重新排序技术,它可以动态地重新排序着色工作以实现更好的执行效率。

透过 Shader Execution Reording 技术,着色器执行重排序时在光线追踪管道中添加了一个新阶段,该阶段对二次命中着色进行重新排序和分组,以具有更好地执行局部性,在 Cyperpunk 2077 RT : Overdrive 模式下,启动 ShaderExecution Reording 技术后性能提升高达 44%,相当惊人。

升级第 4 代 Tensor Cores、全新 DLSS 3 技术

Tensor Cores 是专门为在 AI 和 HPC 应用程序中使用的矩阵乘法和累加数学运算量身定制的高性能运算,可以用于为矩阵计算提供了突破性的性能,这对于深度学习神经网络训练和边缘发生的推理针对游戏应用层面,Tensor Cores 其中一个重点就是加入全新 DLSS 深度学习超级採样技术,透过深度神经网路提取渲染场景的多维特徵,并智慧地组合来自多个帧的细节,以建构高品质 3D 影像。与传统的 AA 技术相比,DLSS 使用更少的输入样本,同时避免了透明度和其他复杂场景元素的算法难度。

全新 Ada Lovelace GPU 微架构升级至第 4 代 Tensor Cores 运算单元,相较上代在 FP16、BF16、TF32、INT8 和 INT4 性能提升2 倍以上,新增 FP8 运算能力 AD102 可提供超过 1.3 PetaFLOPS 的张量处理,并且升级至 DLSS 3 技术能透过深度学习使用 AI 产生整帧以大幅提升性能。

NVIDIA DLSS 2 技术原理。
NVIDIA DLSS 3 技术原理。

DLSS 3 技术是将先前 DLSS 2 技术,透过 Tensor Cores 运动矢量运算与超解析度技术下,在帧与帧之间加插由以 AI 运算产生的新帧,启用 DLSS 3 后,AI 将使用 DLSS 超解析度重建第一帧的 3/4,并使用 DLSS AI 帧生成重建整个第二帧,因此 DLSS 3 重建了总显示像素的 7/8,因此显着提高了性能。

为了令 AI 帧产生的影像不会出现重影、卡顿和模糊等伪影, ADA Lovelace GPU 新增 Optical Flow Accelerator 光流加速器,它能捕获粒子、反射、阴影和照明等资讯,DLSS 3 可以计算场景中的一切是如何从一个像素移动到另一个像素的,令游戏画面不会出现异常重建。

更重要的是 DLSS 3 可以减低 CPU 造成的性能瓶颈,一些需要 CPU 物理模拟的游戏例如 Microsoft Flight Simulator,对于 CPU 的性能要求十分高,因此 GPU 经常处于空闲状态等待指令,DLSS 3 可以将 CPU 密集型游戏转换为 GPU 密集型游戏,因为在 AI 生成帧中全由 GPU 负责,因此在执行 CPU 受限的游戏,例如那些需要大量物理或涉及大型世界的游戏, GeForce RTX 40 系列显卡在相同 CPU 运算能力下,帧速率高达两倍的帧速率进行渲染。

NVIDIA 指出支援 DLSS 3 的游戏将会加速上市,当 11/15 GeForce RTX 4080 发售时,将已有 10 款 DLSS 3 游戏发布:

  1. 《瘟疫传说:安魂曲》(A Plague Tale: Requiem)
  2. 《光明记忆:无限》(Bright Memory: Infinite)
  3. 《毁灭全人类 2:重新探测》(Destroy All Humans! 2 - Reprobed)
  4. 《暗影火炬城》(F.I.S.T.: Forged in Shadow Torch)
  5. 《F1 赛车 22》(F1 22)
  6. 《逆水寒》(Justice)
  7. 《生死轮迴》(Loopmancer)
  8. 《漫威蜘蛛人:重製版》 (Marvel’s Spider-Man Remastered)
  9. 《微软模拟飞行》(Microsoft Flight Simulator )
  10. 《超级人类》(SUPER PEOPLE)

WRC Generations、《极速快感:桀骜不驯》(Need for Speed Unbound) 和 《战鎚 40K:暗潮》(Warhammer 40,000: Darktide) 在 RTX 4080 推出后不久就会发布,圣诞节前玩家就可畅玩这些 DLSS 3 游戏。

升级第 8 代 NVENC 编码引擎

为提升 GPU 编辑性能,AD103 GPU 配搭了两个第 8 代 NVENC 编码器,上代 Ampere GPU 只提供 AV1 解码支援,Ada Lovelace 新增 AV1 编码支援能力,其编码效率相较 H.264 编码器提升了 40%,可支援 8K/60 HDR 或是同时为 4 个 4K/60 HDR 影片编码运算。

解码器方面,AD103 GPU 与上代一样拥有 1 个第 5 代 NVDEC 解码器,支持 MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1 影片格式的硬体加速影片解码,支援 8K/60 解析度。

在相同位元率设定下 H.264 (左) 及 AV1 (右) 的画质表现对比 (建议以 4K 解析度观看影片)。

由于 AV1 编码格式比 H.264 格式的编码效率提升了 40%,变相在相同的位元率设定下 AV1 能提供更高的画面品质,从上述的比较影片中可以看到左边的 H.264 编码格式无法在 8Mbps 频宽下满足 4K 60FPS 的内容,出现了大量不连续的小方块,反之 AV1 在相同位元率下却仍能提供清晰的动态画面,两者可说是高下立判。

NVIDIA GeForce RTX 4080 Founder Edition

收到由 NVIDIA 送测 GeForce RTX 4080 Founder Edition 显示卡,外观设计基本上与 RTX 4090 FE 完全一样,与上代 GeForce RTX 3080 Ti 相似,只有少许细节上的差异,例如金属外框向内微凹,使用的字体亦有所改动,上手后可以感受到 NVIDIA 对细节的重视。

卡的正面都是雾黑色的散热鳍片,边缘採用钛金色铝金属框架,X 框架上刻有 RTX 4080 字样,沿用轴向式散热设计,正反两面各有一个 12cm 散热风扇,能够将部份废热排向 CPU 区域及直接排出机壳,令机壳内部温度变得更平均。

GeForce RTX 4080 Founder Edition 相较 RTX 3080 Ti 更庞大,尺寸为 304mm x 137mm x 61mm 基本上小机壳都可以直接略过,用上 Triple Slot 散热器、双 12cm 轴向式散热风扇,顶端 GeForce RTX 字样在运作时会透出白色 LED 灯效,太炫砲了。

考虑到大部份人安装显示卡后,从机壳外看进去只会看到卡背,NVIDIA 将设计反转了把背板变成正面,并显示着「RTX 4080」字样,整张卡所有螺丝孔都用磁吸隐藏了,NVIDIA 真的是从使用者的角度、在细节中作出了考量,难怪那么多玩家想买 Founder Edition。

NVIDIA PG139 SKU 360

拆开散热器后,可以看到 GeForce RTX 4080 Founder Edition 採用 PG139 SKU 360 公板设计,与 RTX 3080 Ti PCB 布局非常相似 ,NVIDIA 刻意将电路板尽量缩小,让卡身可以镂空让轴向式风扇将带气流带到 CPU 区域,12 Layers PCB 设计并经过低阻抗提供讯号及电力传输最佳化,同时保留了不俗的超频性能。

供电设计方面,16 相供电模组设计,其中 13 相负责 GPU 供电、3 相负责 GDDR6X 供电,採用 Monolithic Power Systems MP2891 VRM 控制晶片配搭 Monolithic Power Systems MP86957 70A DrMOS 晶片。

NVIDIA AD103-300 绘图核心

NVIDIA GeForce RTX 4080 採用了经删减后的 AD103-300 绘图核心,採用 TSMC 4N 製程、拥有 459 亿个电晶体、Die Size 约为 379mm²,部份单元作出了遮蔽,拥有 7 个 GPC 单元、38 个 TPC 纹理处理群集及 76 个 SM 串流多处理器,具备 9,728 个 CUDA Cores、76 个 RT Cores 及 304 个 Tensor Cores。

NVIDIA AD103-300-A1 绘图核心。

核心时脉方面,虽然晶片规模大幅提升但受惠于 TSMC 4N 製程,GPU 时脉相较上代大幅提升,GeForce RTX 4080 FE 预设时脉为 2,205MHz、2,505MHz 加速时脉,支援 GPU Boost 4.0 技术可因应负载自动超频至更高时脉,最高 TGP 为 320W 比 RTX 3080 Ti 低 30W。

256-bit 16GB GDDR6X 记忆体容量

记忆体方面,GeForce RTX 4080 具备 16GB GDDR6X 记忆体容量及 256-bit 记忆体控制器,採用更高速的 22.4Gbps GDDR6X 颗粒,记忆体频宽为 716.8GB/s 虽然比 RTX 3080 Ti 少,但拥有更高的 64MB L2 Cache 容量,以满足更高解析度、更複杂的着色器渲染运算画面。

Micron D8BZF 22.4Gbps GDDR6X 记忆体。

採用了8 颗 Micron D8BZF GDDR6X 颗粒,编号为 MT61K512M32KPA-24,其最高速度为 24Gbps,因此拥有一定记忆体超频空间 ,每颗单颗容量为 16Gbit (2GB),总容量为 16GB 绘图记忆体容量。

Triple Slot 轴向式散热器设计

NVIDIA GeForce RTX 4080 FE 沿用轴向式散热设计,设计与 RTX 3090 Ti 相同只是变得更巨大了,Triple Slot 双 12 cm 风扇,GPU / VRM 及 GDDR6X 记忆体位置被巨型 Vapor Chamber 均热板覆盖,再透过 6 支导热管传导致另一组散热鳍片,搭配两颗 12cm 风扇,其中一颗反叶设计让冷空间穿过卡身未端排向 CPU 区域。

採用 12VHPWR 供电

供电方面,GeForce RTX 4080 Founder Edition 採用 12 +4 Pin 的 12VHPWR 电源接头,单一接头最高可提供 600W 供电,由于原生支援 12VHPWR 连接线的电源供应器 太少,NVIDIA 随产品附上 PCIe 8Pin to 12VHPWR 转接线,由于 RTX 4080 的 TGP 只有 320W,因此附的转接线只需接上 3 个 PCIe 8 Pin 即可,要记住转接线有物理限制,在其触点开始磨损之前可以插拔最大次数 30 次,同时不要过份弯曲使用否则可能会导致短路。

2 个 8K@60Hz HDR 显示输出

NVIDIA GeForce RTX 4080 Founder Edition 提供了 3 组 Display Port 1.4a + DSC 及 2 组 HDMI 2.1 影像输出,两种输出介面皆可提供最高 4K@240Hz 或 8K@60Hz 12bit HDR 解析度输出,支援 VEGA DSC 1.2 无损压缩显示功能,单卡能提供最高 2 个 8K@60Hz HDR 显示输出,或是组合 2 组 DisplayPort 提供单一 8K@120Hz HDR 输出。

效能测试

编辑部收到由 NVIDIA 送测的 GeForce RTX 4080 Founder Edition 显示卡样品,同时亦找来 GeForce RTX 3080 Ti Founder Edition 作对比测试,以了解新一代 GeForce RTX 4080 的效能水準,此次测试使用由 FSP 提供的 Hydro PTM Pro 1000W 电源供应器。

时脉方面,NVIDIA GeForce RTX 4080 FE 预设核心时脉为 2,205MHz、2,505MHz 加速时脉,支援 GPU Boost 4.0 技术最高可达 2,745MHz。


测试平台
处理器Intel Core i9-12900K
主机板ASROCK Z690 AQUA OC
显示卡NVIDIA GeForce RTX 3080 Ti FE、NVIDIA GeForce RTX 3090 Ti FE、NVIDIA GeForce RTX 4080 FE、NVIDIA GeForce RTX 4090 FE、AMD Radeon RX 6950 XT
记忆体G.SKILL DDR5-6000 CL30-38-38-39 16GB x 2 @1.35V
作业系统Windows 11 Professional 22H2
驱动程式NVIDIA GeForce Driver 526.72 WHQL
Furmark 测试 63°C 保持 2,370MHz 时脉水平。

散热方面,NVIDIA GeForce RTX 4080 FE 在约 25°C 的室温环境下闲置约 30分钟,GPU 温度维持在 36°C。接着採用 Furmark 进行 3D 负载测试,将 GPU 完全负载 30 分钟后,温度则提升至 63°C 的,GPU 时脉保持在 2,370MHz,在 Full-Load 时的时脉相较 NVIDIA GeForce RTX 3080 Ti FE 高了近 1GHz。

3DMARK

3DMARK 作为最广泛的 3D 性能基準测试,性能对比结果当然不可缺少,根据测试显示 GeForce RTX 4080 游戏性能相较上代产品有明显提升,性能甚至比上代旗舰相较 RTX 3090 Ti 更高,但不难发现当解析度越来越高,它与 RTX 3090 Ti 的差距就会拉近一点,始终 384bit vs 256bit 记忆体介面啊,3DMark Fire Strike 与 Time Spy 要完胜是没有问题。

FireStrikeFireStrike ExtremeFireStrike UltraTime SpyTime Spy Extreme
GeForce RTX 3080 Ti336672201412215177098996
Radeon RX 6950 XT417452699214819194579290
GeForce RTX 3090 Ti3618924486142251955510046
GeForce RTX 40804716932074162822668613087
GeForce RTX 40905489539440249463310016861

3DMark Ray-Tracing 测试

3DMark Port Royal 是首款针对即时光线追蹤所设计的测试工具,支援 Microsoft DirectX Raytracing 技术,让玩家测试不同显卡对于光线追蹤的效能,拥有第 3 代 RT Core 的 RTX 4080 绝对是神一般的存在,测试得分为 17908 仍能大幅压倒 RTX 3090 Ti 与 RX 6950 XT。

PR
GeForce RTX 3080 Ti12657
Radeon RX 6950 XT10789
GeForce RTX 3090 Ti14771
GeForce RTX 408017908
GeForce RTX 409025995

游戏效能测试

以下的游戏测试除另外注明外,全部皆以 3840 x 2160 解析度全萤幕执行,画质皆设定为最高品质,若游戏支援光线追蹤技术则同时将光追品质全开。而 DLSS 方面则统一使用 Performance 设定,当中 GeForce RTX 4090 亦会启用 DLSS 3 中新增的 Frame Generation 技术。

A Plague Tale : Requiem 瘟疫传说:安魂曲

4K + DLSS Off4K + DLSS On
GeForce RTX 3080 Ti42.178.1
GeForce RTX 3090 Ti44.980.4
GeForce RTX 408055.8138.2
GeForce RTX 409078.5174.9

Cyberpunk 2077 (New RT Overdrive)

4K RT + DLSS OFF4K RT + DLSS On
GeForce RTX 3080 Ti21.859.4
GeForce RTX 3090 Ti24.166.4
GeForce RTX 408030.1114.7
GeForce RTX 409043.2149.8

Destroy All Humans! 2 – Reprobed

4K + DLSS Off4K + DLSS On
GeForce RTX 3080 Ti81.6158.9
GeForce RTX 3090 Ti83.4161.2
GeForce RTX 408094.1177.1
GeForce RTX 4090119.6229.3

F1 22

4K RT + DLSS OFF4K RT + DLSS ON
GeForce RTX 3080 Ti54127
GeForce RTX 3090 Ti60137
GeForce RTX 408069180
GeForce RTX 409096232

Justice Online 逆水寒

4K RT + DLSS Off4K RT + DLSS On
GeForce RTX 3080 Ti5.419.2
GeForce RTX 3090 Ti7.926.6
GeForce RTX 408040.276.2
GeForce RTX 409051.4110.7

Microsoft Flight Simulator 微软模拟飞行

4K + DLSS OFF4K + DLSS ON
GeForce RTX 3080 Ti47.269.1
GeForce RTX 3090 Ti54.181.7
GeForce RTX 408065.9150.9
GeForce RTX 409077.4169.9

Tom Clancy's Rainbow Six Siege 虹彩六号:围攻行动

1080P2K4K
GeForce RTX 3080 Ti595506304
GeForce RTX 3090 Ti598513321
GeForce RTX 4080610586395
GeForce RTX 4090613586517

Tower of Fantasy

4K + DLSS Off4K + DLSS On
GeForce RTX 3080 Ti28.988.6
GeForce RTX 3090 Ti34.2107.6
GeForce RTX 408043.2145.5
GeForce RTX 409059.2190.5

Unity Enemy Demo

4K + DLSS Off4K + DLSS On
GeForce RTX 3080 Ti15.833.54
GeForce RTX 3090 Ti17.442.6
GeForce RTX 408022.777.6
GeForce RTX 409030.197.3

Unreal Engine 5 : Lyra Demo

4K RT + DLSS Off4K RT + DLSS On
GeForce RTX 3080 Ti53104.2
GeForce RTX 3090 Ti58.1114.3
GeForce RTX 408072.4160.6
GeForce RTX 409090.7197.2

DaVinci Resolve Studio 18 硬体编码效能测试

除了游戏性能的提升外,对于一众创作者来说显示卡的硬体的编解码速度同样重要。NVIDIA GeForce RTX 4080 就拥有两个第 8 代 NVENC 编码器,不但新增了 AV1 编码能力,在 H.264 及 H.265 编码速度上亦有明显的提升。

NVIDIA GeForce RTX 3080 Ti FE。
NVIDIA GeForce RTX 4080 FE。

测试採用 DaVinci Resolve Studio 18 影片剪辑软体,分别使用 GeForce RTX 4080 及 RTX 3080 Ti 以 H.265 及 AV1 编码格式各输出一段 4K 及 8K 的影片,结果显示 RTX 4080 的 H.265 编码速度比 RTX 3090 Ti 快了一倍以上,而在 AV1 编码上更比 RTX 3080 Ti 快了无限倍,因为 RTX 3080 Ti 根本不支援 AV1 编码。

测试项目GeForce RTX 3080 Ti FEGeForce RTX 4080 FE
4K30 - H.26500:3300:13
8K30 - H.26502:0000:56
4K30 - AV1不支援00:13
8K30 - AV1不支援00:56

编辑评语

NVIDIA GeForce RTX 4080 作为效能级显示卡,性能大致相较上代 RTX 3080 Ti 快 30 至 90%,并超越了上代旗舰卡,如果启动 DLSS 3 技术效能提升将会更高,整体表现相当不错,现在等待它的是对手 AMD 即将在 12 月发布 Radeon RX 7900 XTX 的考验,如果你是 N 粉那么 RTX 4080 可以买,如果你并没有信仰的话,不妨多等几个礼拜。

资料来源

以上内容及测试数据为 HKEPC 独家授权给 UNIKO's Hardware 编译