NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

NVIDIA GeForce RTX 40 Family Full Specifications。

经改良的 Ada Lovelace 架构

GPC 是 NVIDIA GPU 中最顶层的硬体块,所有关键图形处理单元都位于 GPC 中。 Ada Lovelace 每个 GPC 包括 1 个专用的光栅引擎、 2 个光栅操作 (ROP) 分区,每个分区包含 8 个单独的 ROP 单元和 6 个 TPC,每个 TPC 包括 1 个 PolyMorph 引擎和 2 个 SM。

AD102 GPU 中的每个 SM 包含 128 个 CUDA Core、 1 个 Ada Lovelace 第三代 RT 核心、4 个 Ada Lovelace 第四代 Tensor Cores、4 个 Texture 纹理单元、 1 个 256 KB 档案暂存器和 128 KB 的 L1 / 共享记忆体,可根据图形或计算工作负载需求分配成不同的记忆体大小。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱
Ada Lovelace GPU 的 GPC 框架设计。

与 Ampere GPU 一样,AD102 的 SM 单元分为 4 个分区,每个分区包含 1 个 64 KB 档案暂存器、一个 L0 指令快取、一个 warp 调度程序、一个调度单元、16 个专用于处理 FP32 的 CUDA 核心操作,每个週期最多可处理 16 个 FP32 操作,16 个可以处理 FP32 或 INT32 操作的 CUDA 核心,每个週期 16 个 FP32 操作或每个时钟 16 个 INT32 操作, 4 个加载 / 存储单元,以及执行超越和图形插值指令的特殊功能的 SFU 单元,除了换上第 4 代的 Tensor Core 设计,FP 单元在微架构上并没有太大变动。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱
第三代 RT Core。

与上代 Ampere GPU 相比,Ada Lovelace GPU 的 L2 Cache 进行了彻底改造,完整的 AD104 GPU 拥有高达 49152 KB 的 L2 Cache,相比 GA104 中的 4096 KB 提高了 10 倍,所有应用程式都将受益于拥有如此庞大、更高速的 L2 Cache,例如 Ray Tracing 光线追踪当中的路径追踪之类的複杂操作将产生最大的好处,相较 AMD 的 Infinity Cache 作为 L3 Cache 拥有更高效率,能大幅升游戏 Workload 资料命中率,降低读取延迟并减少 GDDR6X 记忆体频宽使用。

此外,AD104 GPU 受惠于 TSMC 4N 製程,在 NVIDIA 工程师与 TSMC 密切合作下令 AD104 包含的 CUDA 核心比上一代 GA104 更多,但 Die Size 却缩减少约 24%,拥有高达 358 亿个电晶体较上代多 51%,并且关键路径中使用高速晶体管设计,令 AD104 GPU 时脉可运作于 2.5GHz 甚至更高,并提供了更出色的能耗比,RTX 4070 Ti 性能是 RTX 3070 Ti 的 1 倍,但功耗表现却相约,如果启用 RT + DLSS 3 技术后,性能提升甚至最高可达 2 倍。

升级第 3 代 Ray Tracing 引擎

Ray Tracing 光线追踪技术是一种密集型渲染技术,可以逼真地模拟场景及物件的光线,即时以物理方式渲染正确的反射、折射、阴影及间接照明效果。过去的 GPU 架构并无法对游戏及图形进行複杂的即时光线追踪处理,NVIDIA 经过过 10 年的研究及开发,终于在 GeForce RTX 20 的「Turing」GPU 微架构中加入硬体光线追踪加速引擎 —「RT Cores」,结合 NVIDIA RTX 软体引擎,实现逼真的实时光线场景效果。

到了 GeForce RTX 30 系列的 Ampere GPU 升级了第 2 代的 RT Cores,BVH 遍历与射线三角交测运算能力提升了 2 倍,第 1 代 Turning SM 在 Ray Tracing 运算时不能同时执行绘图或运算,到了 Ampere SM 强化了异步运算能力,当执行 Ray Tracing 运算时可同步进行绘图或运算,令 Ray Tracing 的游戏执行效率大大提升。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱
第 2 代 RT Core。

来到 GeForce RTX 40 的 Ada Lovelace GPU 升级至第 3 代 RT Cores,它的 Triangle Intersection Engine 相较上代快 2 倍的 Ray-Triangle 相交吞吐量,能为游戏场景中加入更多细节,同时有快 2 倍的 Alpha Traversal 处理能力,新增 Opacity Micromap Engine 直接对几何物件进行 alpha 测试,并显着减少基于着色器的 alpha 运算量。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱
第 3 代 RT Core。

在 Ada Lovelace GPU 之前,当光线扭曲投射到不同程度透明级别的物件时,例如叶子或火焰等複杂形状通常使用纹素的 alpha 通道来表示,单个光线运算也可能需要多次着色器调用才能完成,即使光线只是简单地表徵为命中或未命中都需要大量的运算成本。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

为了更有效处理此类内容,NVIDIA 工程师在第 3 代 RT Core 中增加了 Opacity Micromap Engine,为非不透明物件产生微三角形的虚拟网格,每个微三角形都具有不透明状态,RT Core 使用该状态直接解析与非透明三角形的光线交叉点,令 Alpha 场景遍历性能大幅提升,性能升幅很大程度取决于使用情况,如果场景出现大量投射在 alpha 测试几何体上的阴影光线时会看到最大的收益。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

第 3 代 RT Core 另一个重要提升是添加 Displaced Micro-Mesh Engine,透过将几何结构换成微网格,利用 LOD 细节层进行光栅化,相较使用传统三角几何光线追蹤处理,不仅拥有更多细节,相较上代 BVH 数据构建速提升了 10 倍, BVH 所需资料容量减少了 20 倍,而且对複杂环境进行光线追踪时,追踪成本缓慢增加,几何增加 100 倍可能只会增加 1 倍追踪时间。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

上代 Ampere GPU 可能需要 1024 个三角几何与複杂的 BVH 结构进行的光线追踪,同样的效果透过 Displaced Micro-Mesh Engine,只需要 1 个基础三角形和 1个更换贴图定义及简单的 BVH 结构就能完成,可以在不相应增加处理时间或记忆体消耗的情况下实现丰富度的数量级增加。

Shader Execution Reording 技术

为实现游戏即时光线追踪的逼真渲染,运算时增加了大量的环境中模拟光线运动,同时亦意味着 GPU 原始处理工作量变得越来越不连贯。例如,用于反射、间接照明和半透明效果的二次光线往往会射入,不同的方向并击中不同的材质,导致二次击中着色器的有序性和效率较低,不规律性的运算会导致 GPU 的处理单元 SM 的低效使用,因此 NVIDIA 在 Ada Lovelace GPU 架构中加入 Shader Execution Reording 着色器执行重新排序技术,它可以动态地重新排序着色工作以实现更好的执行效率。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

透过 Shader Execution Reording 技术,着色器执行重排序时在光线追踪管道中添加了一个新阶段,该阶段对二次命中着色进行重新排序和分组,以具有更好地执行局部性,在 Cyperpunk 2077 RT : Overdrive 模式下,启动 ShaderExecution Reording 技术后性能提升高达 44%,相当惊人。

升级第 4 代 Tensor Cores、全新 DLSS 3 技术

Tensor Cores 是专门为在 AI 和 HPC 应用程式中使用的矩阵乘法和累加数学运算量身定制的高性能运算,可以用于为矩阵计算提供了突破性的性能,这对于深度学习神经网路训练和边缘发生的推理针对游戏应用层面,Tensor Cores 其中一个重点就是加入全新 DLSS 深度学习超级採样技术,透过深度神经网络提取渲染场景的多维特徵,并智能地组合来自多个帧的细节,以构建高品质 3D 影像。与传统的 AA 技术相比,DLSS 使用更少的输入样本,同时避免了透明度和其他复杂场景元素的算法难度。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

全新 Ada Lovelace GPU 微架构升级至第 4 代 Tensor Cores 运算单元,相较上代在 FP16、BF16、TF32、INT8 和 INT4 性能提升2 倍以上,新增 FP8 运算能力 AD102 可提供超过 1.3 PetaFLOPS 的张量处理,并且升级至 DLSS 3 技术能透过深度学习使用 AI 生成整帧以大幅提升性能。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱
NVIDIA DLSS 2 技术原理。
NVIDIA GeForce RTX 4070 FE 显示卡评测开箱
NVIDIA DLSS 3 技术原理。

DLSS 3 技术是将先前 DLSS 2 技术,透过 Tensor Cores 运动矢量运算与超解析度技术下,在帧与帧之间加插由以 AI 运算生成的新帧,启用 DLSS 3 后,AI 将使用 DLSS 超解析度重建第一帧的 3/4,并使用 DLSS AI 帧生成重建整个第二帧,因此 DLSS 3 重建了总显示像素的 7/8,因此显着提高了性能。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

为了令 AI 帧成生的影像不会出现重影、卡顿和模糊等伪影, ADA Lovelace GPU 新增 Optical Flow Accelerator 光流加速器,它能捕获粒子、反射、阴影和照明等资讯,DLSS 3 可以计算场景中的一切是如何从一个像素移动到另一个像素的,令游戏画面不会出现异常重建。

更重要的是 DLSS 3 可以减低 CPU 造成的性能瓶颈,一些需要 CPU 物理模拟的游戏例如 Microsoft Flight Simulator (微软模拟飞行),对于 CPU 的性能要求十分高,因此 GPU 经常处于空闲状态等待指令,DLSS 3 可以将 CPU 密集型游戏转换为 GPU 密集型游戏,因为在 AI 生成帧中全由 GPU 负责,因此在执行 CPU 受限的游戏,例如那些需要大量物理或涉及大型开放世界的游戏, GeForce RTX 40 系列显卡在相同 CPU 运算能力下,帧速率高达两倍的帧速率进行渲染。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

升级第 8 代 NVENC 编码引擎

为提升 GPU 编辑性能,AD104 GPU 配备了两个第 8 代 NVENC 编码器,上代 Ampere GPU 只提供 AV1 解码支援,Ada Lovelace 新增 AV1 编码支援能力,其编码效率相较 H.264 编码器提升了 40%,可支援 8K / 60 HDR 或是同时为 4 个 4K / 60 HDR 影片进行编码运算。

NVIDIA GeForce RTX 4070 FE 显示卡评测开箱

解码器方面,AD104 GPU 与上代一样拥有 1 个第 5 代 NVDEC 解码器,支援 MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1 影片格式的硬体加速影片解码,支援 8K / 60 解析度。以下为在同等位元率设定下 H.264 (左) 及 AV1 (右) 的画质表现对比,建议用 4K 解析度观看。

由于 AV1 编码格式比 H.264 格式的编码效率提升了 40%,变相在相同的位元率设定下 AV1 能提供更高的画面品质,从上述的比较影片中可以看到左面的 H.264 编码格式无法在 8Mbps Bandwidth 下满足 4K 60FPS 的内容,出现了大量不连续的小方块,反之 AV1 在相同位元率下却仍能提供清晰的动态画面,两者可说是高下立见。

NVIDIA GeForce RTX 4070 Founder Edition

显示卡外观

NVIDIA GeForce RTX 4070 Founder Edition 显示卡外观设计上与 RTX 4080 / RTX 4090 有所不同,变得较像旧代 RTX 30 FE 设计,例如金属外框不再向内微凹,换回钛灰色金属框架,X 框架亦回复至银白色,如果不是上面刻有 RTX 4070 字样,同时 GeForce RTX 字体亦换上新版,还以为是寄错了旧卡来呢。

卡的正面都是雾黑色的散热鳍片,沿用轴向式散热设计,正反两面各有一个 10 cm 轴向式散热风扇,能够将部份废热排向 CPU 区域及直接排出机箱,令机箱内部温度变得更平均,唯一美中不足是 RTX 4070 FE 的 GeForce RTX 字样并不会发光,变成了 RTX 4080 / 4090 FE 的专利。

NVIDIA GeForce RTX 4070 Founder Edition 相较 RTX 4080 / 4090 来说体积小巧玲珑,Dual Slot 设计、尺寸只有 230 mm x 122 mm x 40 mm、重量为 1,014g,大部份 A4 机壳都可以放得下,官方指出在闲置下功耗大约 10W,播放影片约 16W,游戏平均功耗 (AGP) 约 186W,最高 TGP 为 200W,建议使用 650W 或以上的电源供应器。

考虑到大部份人安装显示卡后,从机壳外看进去只会看到卡背,NVIDIA 将设计反转了把背板变成正面,并显示着「RTX 4070」字样,整张卡所有螺丝孔都用磁吸隐藏了,NVIDIA 真的是从使用者的角度、在细节中作出了考量,难怪那么多玩家想买 Founder Edition。

NVIDIA PG141-SKU344 公板设计

拆开散热器,可以看到 GeForce RTX 4070 Founder Edition 採用 PG141-344 公板设计,NVIDIA 刻意将电路板尽量缩小,让卡身可以镂空让轴向式风扇将带气流带到 CPU 区域,8 Layers PCB 设计并经过低阻抗提供讯号及电力传输最佳化,同时保留了不俗的超频性能。

供电设计方面, 5 相为 GPU 供电、3 相为 GDDR6X 供电,全面採用 Alpha & OMEGA BLN3 (AOZ5311NQI) Synchronous Buck Regulator,在单一封装内加入上下桥 MOSFET 及集成驱动器,单相能提供 55A 持续电流输出。

NVIDIA AD104-250 绘图核心

GeForce RTX 4070 使用 AD104-250 绘图核心,採用 TSMC 4N 製程、拥有 358 亿个电晶体、Die Size 约为 295mm²,相较 RTX 4070 Ti 的 AD104-400 绘图核心,运算单元数目作出了删减,由 5 个 GPC 单元减至 4 个、共 23 个 TPC 纹理处理群集及 46 个 SM 串流多媒体处理器,具备 5,888 个 CUDA Cores、46 个 RT Cores、 184 个 Tensor Cores、184 个 Texture Unit 及 64 个 ROP。

NVIDIA AD104-250 绘图核心。

时脉方面,GeForce RTX 4070 亦较 RTX 4070 Ti 低,NVIDIA GeForce RTX 4070 FE 预设时脉为 1,920MHz、加速时脉 2,475MHz,支援 GPU Boost 4.0 技术可因应负载自动超频至更高时脉,Power Limit 预设为 200W。

192-bit 12GB GDDR6X 记忆体容量

记忆体方面,GeForce RTX 4070 支援 192bit 记忆体控制器,虽然比 RTX 3070 的 256bit 下降了,但採用 21Gbps GDDR6X 记忆体颗粒,速度较 RTX 3070 的 14Gbps GDDR6 高出不少,因此最高记忆体频宽由上代 448GB/s 提升至 504GB/s, 与 RTX 4070 Ti 看齐。

Micron D8BZC 21Gbps GDDR6X 记忆体。

NVIDIA GeForce RTX 4070 FE 採用了 6 颗 Micron D8BZC GDDR6X 颗粒编号,为 MT61K512M32KPA-21:U,每颗单颗容量为 16Gbit (2GB),总容量 12 GB 绘图记忆体容量。

Dual Slot 轴向式散热器设计

NVIDIA GeForce RTX 4070 FE 沿用轴向式散热设计,设计与 RTX 4080 / 4090 相似只是规模变细了,Dual Slot、双 10 cm 风扇,由于 RTX 4070 只有 200W TGP,因此没有用上 Vapor Chamber 均热板,仅使用铜底部搭配 4 支 Heatpipe 导热管便足够。

採用 12VHPWR 供电接头

採用 12 +4 Pin 的 12VHPWR 供电接头,相较 PCIe 8 Pin 能提供大于 225W 的供电潜力,由于目前原生支援 12VHPWR 连接线的 PSU 并不普及,随产品就附了一条 PCIe 8-Pin x 2 转 12VHPWR 的转接线 (300W)。

提供了 3 组 Display Port 1.4a + DSC 及 2 组 HDMI 2.1 影像输出孔,两种输出介面皆可提供最高 4K@240Hz 或 8K@60Hz 12bit HDR 解析度输出,支援 VEGA DSC 1.2 无损压缩显示功能,单卡能提供最高 2 个 8K@60Hz HDR 显示输出,或是组合 2 组 DisplayPort 提供单一 8K@120Hz HDR 输出。

GeForce RTX 4070 FE 效能测试

以下将以 RTX 3070 / RTX 3070 Ti / RTX 3080 / RTX 4070 Ti 作对比测试,以了解 NVIDIA GeForce RTX 4070 的效能水準。

时脉方面,NVIDIA GeForce RTX 4070 FE 预设核心时脉为 1,920MHz、加速时脉 2,475MHz,支援 GPU Boost 4.0 技术最高可达 2,820MHz。

散热方面,NVIDIA GeForce RTX 4070 FE 在约 24°C 的室温环境下闲置约 30分钟,GPU温度维持在 35°C。接着採用 Furmark 进行 3D 负载测试,将 GPU 完全负载 30 分钟后,温度会提升至 66°C,GPU 时脉保持在 1,995MHz,TGP 为 196.9W。

Furmark 测试最高温度 66°C。

测试平台︰

  • Intel Core i9-12900K CPU
  • ASUS ROG Z690 Maximus Hero MB
  • NVIDIA GeForce RTX 3080 FE
  • NVIDIA GeForce RTX 3070 Ti FE
  • NVIDIA GeForce RTX 4070 FE
  • G.SKILL DDR5-6000 CL30-38-38-39 16GB x 2 @1.35V
  • Windows 11 professional 22H2
  • NVIDIA GeForce Driver 531.42 WHQL

3DMark Fire Strike 与 Time Spy 作为最广泛的 DX11 / 12 性能基準测试,性能对比结果当然不可缺少,根据测试显示 GeForce RTX 4070 游戏性能较旧代 RTX 3070 / 3070 Ti 优胜,与 RTX 3080 性能非常相近。

GPU3DMFS3DMFSE3DMFSU
GeForce RTX 307033077165898571
GeForce RTX 3070 Ti34983177939137
GeForce RTX 3080415762062610650
GeForce RTX 3080 Ti451312331212098
GeForce RTX 3090491022496412912
GeForce RTX 3090 Ti527612716014264
GeForce RTX 4070449272174010100
GeForce RTX 4070 Ti551972734513547
GeForce RTX 4080655083386516270
GeForce RTX 4090821624695325294
GPU3DMTS3DMTS
GeForce RTX 3070136416821
GeForce RTX 3070 Ti143857237
GeForce RTX 3080171308639
GeForce RTX 3080 Ti187429697
GeForce RTX 30902071610507
GeForce RTX 3090 Ti2162711295
GeForce RTX 4070178898539
GeForce RTX 4070 Ti2282610987
GeForce RTX 40802825214074
GeForce RTX 40903726319630

3DMark Ray-Tracing 测试

3DMark Port Royal 与 Speed Way 是针对即时光线追蹤所设计的测试工具,支援 Microsoft DirectX Raytracing 技术,让玩家测试不同显卡对于光线追蹤的效能,NVIDIA GeForce RTX 4070 Ti 的测试较 RTX 3070 / 3070 Ti 高,同样与 RTX 3080 不相上下。

GPU3DMPR3DMSW
GeForce RTX 307082193501
GeForce RTX 3070 Ti87263680
GeForce RTX 3080111884589
GeForce RTX 3080 Ti126575219
GeForce RTX 3090133635492
GeForce RTX 3090 Ti145335981
GeForce RTX 4070111954475
GeForce RTX 4070 Ti141885435
GeForce RTX 4080179087281
GeForce RTX 4090259559998

3DMark DLSS 测试

3DMark NVIDIA DLSS feature test 测试透过利用 Tensor Core 以深度学习方式对较低的渲染解析度的画面进行运算,重新输出更高解析度的画面,令游戏流畅度有所提升,新增全新 DLSS 3 版本,并支援全新 Frame Generation 功能,此次测试会採用 3840 x 2160 解析度,测试 DLSS OFF、DLSS 2 及 DLSS 3 的性能差异。

可以看到 GeForce RTX 4070 在 DLSS Feature Test 表现与 RTX 3080 接近,但如果游戏支援 DLSS 3 的话,它的性能就能提升超越 RTX 3090 Ti 的水平。

GPUDLSS OffDLSS2DLSS3
GeForce RTX 307015.6142.62
GeForce RTX 3070 Ti16.6644.74
GeForce RTX 308022.0155.64
GeForce RTX 3080 Ti26.3765.51
GeForce RTX 309028.4569.85
GeForce RTX 3090 Ti32.8881.16
GeForce RTX 407023.0958.5785.09
GeForce RTX 4070 Ti29.7576.14104.88
GeForce RTX 408037.6399.17131.84
GeForce RTX 409056.35138.32171.22

3DMark DirectX Raytracing feature test 测试

採用 3DMark DirectX Raytracing feature test 跑分测试,由于运作于 Microsoft DXR API 的光线追蹤模式,结果显示 NVIDIA GeForce RTX 4070 FE 取得 51.71 FPS,性能介乎于 RTX 3080 与 RTX 3080 Ti 之间。

GPURT
GeForce RTX 307032.18
GeForce RTX 3070 Ti33.28
GeForce RTX 308044.16
GeForce RTX 3080 Ti54.05
GeForce RTX 309055.73
GeForce RTX 3090 Ti61.69
GeForce RTX 407051.71
GeForce RTX 4070 Ti66.69
GeForce RTX 408083.29
GeForce RTX 4090139.98

游戏效能测试

以下的游戏测试除另外注明外,全部皆以 2560 x 1440 解析度全萤幕执行,画质皆设定为最高画质,若游戏支援光线追蹤技术则同时将光追画质全开。而 DLSS 方面则统一使用 Performance 设定,此外 GeForce RTX 4070 亦会启用 DLSS 3 中新增的 Frame Generation 技术。

A Plague Tale:Requiem 瘟疫传说:安魂曲 (RT + DLSS 3)

GPU2K DLSS Off2K DLSS On
GeForce RTX 30703957
GeForce RTX 3070 Ti4161
GeForce RTX 30805282
GeForce RTX 407051107
GeForce RTX 4070 Ti74146

Control (RT + DLSS2)

GPU2K DLSS Off2K DLSS On
GeForce RTX 30705598
GeForce RTX 3070 Ti59106
GeForce RTX 308078133
GeForce RTX 407076129
GeForce RTX 4070 Ti85141

CyberPunk 2077 RT Ultra (RT+ DLSS 3)

GPU2K DLSS Off2K DLSS On
GeForce RTX 30702451
GeForce RTX 3070 Ti2854
GeForce RTX 30803667
GeForce RTX 407038106
GeForce RTX 4070 Ti51131

F1 22 (RT + DLSS 3)

GPU2K DLSS Off2K DLSS On
GeForce RTX 30705996
GeForce RTX 3070 Ti62102
GeForce RTX 308076118
GeForce RTX 407078159
GeForce RTX 4070 Ti89181

Forza Horizon 5 (DLSS 3)

GPU2K DLSS Off2K DLSS On
GeForce RTX 307078101
GeForce RTX 3070 Ti82105
GeForce RTX 3080117151
GeForce RTX 4070119173
GeForce RTX 4070 Ti148201

Tom Clancy's Rainbow Six Siege 虹彩六号:围攻行动

GPU1080p2K4K
GeForce RTX 3070420327188
GeForce RTX 3070 Ti431342196
GeForce RTX 3080473390242
GeForce RTX 4070493387228
GeForce RTX 4070 Ti585513312

Microsoft Flight Simulator 微软模拟飞行 (DLSS 3)

GPU2K DLSS Off2K DLSS On
GeForce RTX 30704666
GeForce RTX 3070 Ti4871
GeForce RTX 30806397
GeForce RTX 407068139
GeForce RTX 4070 Ti76163

Watch Dogs Legion (RT + DLSS)

GPU2K DLSS Off2K DLSS On
GeForce RTX 30706496
GeForce RTX 3070 Ti68101
GeForce RTX 308076127
GeForce RTX 407073121
GeForce RTX 4070 Ti101139

总结

上代 RTX 3070 与 RTX 3070 Ti 性能相近,但这代老黄大刀一挥令 RTX 4070 规格与 RTX 4070 Ti 有着明显差距,主要原因是 RTX 4070 Ti 原本是 RTX 4080 12GB,

从测试结果可以看到,GeForce RTX 4070 真实性能与 RTX 3080 相当相近,以往 70 新卡都能以下犯上力剋 80 旧卡 ,这代 Shader 原始性能提升幅度不大,没输 RTX 3080 旧卡已经有所交代。

不过,当游戏支援 DLSS 3 的情况下,就能发挥第 4 代 Tensor Core 的真正实力,性能相较 RTX 3080 快 20~40% 不等,更重要是它的 TGP 只有 200W,性能功耗比相当出色,加上新增 AV1 硬体编解码支援,如果你原本打算入手 RTX 3070 Ti 或 RTX 3080 的话,RTX 4070 将会是更好的选择。

GeForce RTX 4070 官方网站

资料来源

以上内容及测试数据为 HKEPC 独家授权给 UNIKO's Hardware 编译