NAVI 31 来了!AMD Radeon RX 7900 XTX、RX 7900 XT 评测开箱

AMD Radeon RX 7900 系列正式解禁,共有两个型号,分别是 RX 7900 XTX 和 RX 7900 XT。这是 AMD 首款导入 Chiplet 技术的 GPU,配置 1 颗 GCD 与 6 颗 MCD 晶片集成设计,和上个世代相比同样功耗下提升 54% 效能,升级第 2 代 Infinity Cache 和第 2 代光线追蹤引擎,更是增加了 ML 和 AI 加速运算单元,RX 7900 XT 与 RX 7900 XTX 对比 RTX 4080 差异有多少呢?

目录

RDNA 3 架构探讨

  • 先进的 Chiplet 设计,5nm 显示晶片和 6nm 记忆体快取晶片。
  • GPU 核心可达 3Ghz, 61 TFLOPs FP32,1.54 倍的每瓦功耗效能。
  • 全新的 ALU 指令和吞吐量,2 倍快速 ALU,支援 BF16,指令更有效率。
  • 优化兼具平衡的快取系统,96 MB 第 2 代 Infinity 快取,6MB L2 快取、3MB L1、3MB L0 快取。
  • 第 2 代光线追蹤,提升光追效率,更大的快取,提升 1.8 倍的光追性能。
  • 柔性命令指令和几何运算,MDIA 加速器,12 primitive/clk 增加 50%,2 倍的硬体 Prim / Vert 剔除率。
  • Pixel Pipe 更先进,光栅化 CLK 增加 50%、192 Pixels CLK 增加 50%,像素等待同步。
  • 高速的 GDDR6 记忆体,20Gbps ~ 690 GB/s,最大 24GB 记忆体。
  • AMD Radiance Display Engine,包含新的 DisplayPort 2.1、HDMI 2.1a 介面,12 位元通道,最多 680 一种颜色。
  • Dual Media Engine,AVC / HEVC 编码和解码,8K60 AV1 编码解码,导入 AI 增强解码。
  • 其他特点方面,完整的 DX 12 终极版支援,Fidelity FX 超级解析度,AMD Advantage 智慧技术。

RDNA 3 NAVI 31 採用全新的 Chiplet 小晶片技术,改成 1 颗 5nm GCD 显示晶片和 6 MCD 颗记忆体快取晶片,AMD 把 Infinity 快取和记忆体控制器切分成 MCD 记忆体快取晶片,Infinity Link 及 Die-to-Die Fanout Rounting 让 GCD 和 MCD 可以更低的延迟,当然这也是 GPU 可以 OC 到 3GHz 的技术。

Compute Unit 计算单元 

Navi 31 拥有 6 组 Shader Engine,皆拥有 2 组 Graphics Array 运算群,Graphics Array 运算群内有 4 组 Dual Compute Unit (DCU),所以 Shader Engine 里面只有 8 组 Dual Compute Unit,并共享 L1 快取、Rasterizer、RB+、Prim Unit 相关资源,所以一共有 96 组 Compute Unit 计算单元。快取方面也增加不少,96 MB 第 2 代 Infinity 快取,6MB L2 快取、3MB L1、3MB L0 快取。

同时也加入了 AI 加速运算单元, Vector Unit 能进行 Matrix 矩阵运算,指令支援新增 BFloat16,另外还有 WMMA 矩阵乘法。

Ray Tracing 第 2 代光线追蹤

第 2 代 Ray Accelerator (RA) 加速单元,增强了 BVH 遍历与射线三角运算能力,增加 Geometry Flags 和 Ray Flags 机制。

光追相关指令支援 Closest First、Largest First 和 Closest Midpoint,整体来说比以往 RDNA 2 光追效果提升 80% 以上,但是还是比 RTX 40 系列有差距。

快取系统和命令处理器

快取 CACHE 一直是 AMD 最为重视的架构技术之一,AMD 用以增强架构内部的输传速率。AMD 增大 RDNA 3 内的 L1 和 L2 快取,使每个处理单元能够享用更宽阔的快取。L3 快取被 AMD 称为 INFINITY CACHE,是 RNDA 架构内重要的一环。在 RDNA 3 中 L3 快取亦被大幅加阔以提高整体的吞吐量。RDNA 3 显示卡的记忆体亦透过 384-BIT配合 64-BIT GDDR6 20Gbps。这些改进使 AMD 足以放弃功耗和发热量更大的 GDDR6X 技术,同时保持高竞争力。

高频率、大快取、更快的记忆体、架构改进等等,令 AMD 能够对外宣传 RDNA 3 在光线追蹤上达到 1.8X 的性能增幅。

RDNA 3 另一个重要的架构改进是加入指令处理器 COMMAND PROCESSOR、几何运算GEOMETRY 和像数管道PXIEL PIPELINES,以实现全新的 DUAL MEDIA ENGINE 双重的多媒体引擎,支援 AV1 编码和解码,AI 增强的影片解码,和全新的 RADIANCE 显示引擎。这些改进使 RDNA 3 在运算的时候能够减轻受到 CPU 拖累而带来的影响,并大幅提升 RDNA 3 的运算能力。在编码与解码的範畴上,RDNA 3 加入 AV1,追上了 INTEL 的新架构。影像输出的部份,RDNA 3 首次支援 DISPLAY PORT 2.1,以强大的运算能力匹配巨大的 DP 2.1 频宽。

关于散热器和 PCB 用料

绝佳的散热设计,铝合金压制外壳,强化铝合金背板,使用更高导热散热膏,MOSFET 和记忆体可以有更好的散热。

RX 7900 XTX 有 RGB 灯光,温度够低也有零转速风扇,更大的轴向式风扇,首次导入进气风扇感应器。

供电採用 20 组 Power-Stage 设计,白金等级 IT-170 材料,Low PCIe 插槽峰值电流,14 层高品质 PCB,并有 4 层 2 oz. 铜,更好的电流效率。

AMD RADEON RX 7900
 RX 7900 XTXRX 7900 XT
架构RDNA 3RDNA 3
製程5nm + 6nm5nm + 6nm
电晶体数量57.7 B57.7 B
核心大小300 mm^2 + 220 mm^2300 mm^2 + 220 mm^2
运算元件9684
光线加速器9684
流处理器61445376
游戏频率2300 MHz2000 MHz
加速频率2500 MHz2400 MHz
峰值单精度计算效能61 TFLOPs52 TFLOPs
峰值半精度计算效能123 TFLOPs103 TFLOPs
尖峰像素填充速率480 GP/s460 GP/s
尖峰纹理填充速率960 GT/s810 GT/s
ROPs192192
AMD Infinity Cache96 MB80 MB
记忆体24 GB GDDR620 GB GDDR6
记忆体速度20 Gbps20 Gbps
记忆体介面384-bit320-bit
PCIe 介面PCIe 4.0×16PCIe 4.0×16
TBP355 W315 W
电源供应器建议800 W750 W
SOURCE: AMD

Dual Media Engine

新的 Dual Media Engine 新增 AV1 8K60 硬体编码,可以以相同位元率带来更高品质的内容,或以相同品质减少档案大小,新的媒体引擎允许两个 AVC 和 HEVC 串流同时编码或解码。

影像编码和解码
VP9H.264H.265AV1
解码4K210 / 8K48 (4:2:0 8/10b)4K330 (4:2:0 8b)4K210 8K48 (4:2:0 8/10b)4K240 8K60 (4:2:0 8/10/12b)
编码4K180 (4:2:0 8b)4K180 8K48 (4:2:0 8/10b)4K240 8K60 (4:2:0 8/10b)
SOURCE: AMD

AMD Radiance Display Engine

AMD RDNA 3 新的 Radiance Display Engine 包含新的 DisplayPort 2.1 介面,频宽高达 54 Gbps,可以支援更高刷新率的萤幕。

AMD Radiance Display Engine 支援高达 4 个显示器。

影像输出规格
Radeon RX 6950 XTRadeon RX 7900 系列
DisplayPort 版本DP 1.4DP 2.1
最大刷新率 2K480 Hz900 Hz
最大刷新率 4K240 Hz480 Hz
最大刷新率 8K60 Hz165 Hz
SOURCE: AMD
输出萤幕支援
解析度最大萤幕数量支援
FHD4804
FHD6002
QHD4802
WQHD2
4K1444
4K2402
4K4801
UW5K2402
5K604
5K1442
6K604
6K1442
UW8K2K120/1442
UW8K2K2401
8K602
8K120/144/1651
SOURCE: AMD

RX 7900 XTX、RX 7900 XT 包装

两张显示卡包装盒都採用硬纸板,感觉很扎实。体积和样式十分相像,看起来只有产品各自的外型图、名称、和一些产品细节资料不同。

RX 7900 XTX 採上掀式包装,一打开"Welcom to the red team",欢迎来到红队这句标语就映入眼帘,相信 RADEON 粉丝会很有归属感,包装内没有任何线材,只有说明书。

RX 7900 XTX 盒子设计相当有趣,上掀开启后显示卡会被底座撑起来,有放置高级产品的味道。RX 7900 XT 就没有撑起的设计,少了一点惊喜,但两者包装已经非常相似。

还有个值得一提的小巧思,就是在放置显卡的凹槽,接近右上方的位置有 3 条细细的红线,反向看发现居然与显示卡上红色散热鳍片呼应再延伸,RED 三个红色字体、鳍片与包装的三条红线都暗藏着这是 RDNA3 的讯息。

RX 7900 XTX 外观,有质感又漂亮

RX 7900 XTX 整体配色採用黑为主,搭配上部分银色,整体外壳都是压铸铝合金,金属质感满满,另外在顶部的散热鳍片,靠近双 8-Pin 连接器,可以看到 3 条红线,呼应了 RDNA 3。整张卡算起来就是 375W 供电设计,但是实际上只需要 355W,而且并没有採用新世代 12VHPWR 连接埠设计,现在看来这也算是件好事。

显示卡正面中央风扇四周白色透明导光是 RX 7900 XTX 唯一独有的 RGB 灯效,相当低调。

跟上一世代的 Radeon RX 6000 系列方正设计相比,这一代完全有不同感受。

更多切削角度让显示卡看起来更圆润,同时也有看起来体积较小的感觉,显示卡尾端有 4 组支撑架螺丝孔可用于固定显示卡。

显示卡背护甲採用一体设计,除了可以看到 RADEON 文字,还可以看到 5 个红色三角形点装饰,连接起来可以写出一个"R"。

2.5 Slots 设计,上面可以看到显示卡相关型号和序号,以往较少看到这样配置,影像输出方面有 4 组连接埠,2 组 DisplayPort 2.1、1 组 TYPE-C (DisplayPort 2.1)、1 组 HDMI 2.1a。

RX 7900 XTX 最后方风扇里面藏有一颗针对进气风扇的感应器,没仔细看真的会遗漏。

RX 7900 XT 外观

与 RX 7900 XTX 很相似的设计,整体都是压铸铝合金外壳,但无光害,没有任何 RGB 灯效设计;同样是双 8-Pin 连接器,所以整张卡最多可以拥有 375W 电力,但是实际上只需要 315W。

同样 2.5 Slots 设计,在上面可以看到显示卡相关型号和序号,有 2 组 DisplayPort 2.1、1 组 TYPE-C (DisplayPort 2.1)、1 组 HDMI 2.1a。

体积与外观

RX 7900 XTX 体积为 287mm x 125mm,2.5 Slots,重量 1807g、RX 7900 XT 体积 267mm x 112mm,2.5 Slots,重量 1519g。由于高度不平整,故改以所占用的 Slots 作为计算单位。

展示 5 张显示卡的体积差异,由上而下分别是:

  • AORUS RTX 4090 MASTER
  • AMD RADEON RX 5700 XT
  • AMD RADEON RX 6900 XT
  • AMD RADEON RX 7900 XT
  • AMD RADEON RX 7900 XTX

实测效能数据

测试平台室温控制在 26 度,无辅助风扇直吹测试平台,测试中关闭 Windows 内建防毒、关闭休眠设定,无更动电源计画,并开启 Resizable BAR。X670E 平台开启 DDR5-6000 UCLK:MCLK (1:1)。

  • Windows 11 Professional 22H2
  • AMD-Software-Adrenalin-Edition-22.40.00.57
  • NVIDIA 521.90 Gamereadywin11_win10dch_64bit_international
  • AMD Chipset 4.11.15.342
种类型号
处理器:AMD Ryzen 9 7950X
主机板:MSI MEG X670E ACE /7D69v142
记忆体:G.SKILL Trident Z5 Neo 16GB x 2DDR5 6000 CL30 (EXPO)
显示卡:AMD RADEON RX 7900 XTXAMD RADEON RX 7900 XTNVIDIA GEFORCE RTX 4080
储存:KLEVV CRAS C920 Gen4x4 2TB
机壳:STREACOM BC1
电源:FSP Hydro PTM PRO ATX3.0 1200W
散热器:MONTECH METAL DT24 Premium
显示器:VG289Q

RX 7900 XTX 功耗和温度测试

功耗测试使用 FURMARK 和 3DMARK Time Spy EXTREME 进行烧机测试。

FURMARK 烧机 TBP 功耗约 347W,GPU 温度是 68 度、Hot Spot 74.7 度、风扇转速 1810 RPM,GPU 频率可达 2045 MHz、记忆体 2487 MHz。

Time Spy EXTREME 烧机 TBP 功耗约 338W,GPU 温度是 68 度、Hot Spot 72.8 度、风扇转速 1708 RPM,GPU 频率可达 2332 MHz、记忆体 2487 MHz。

RX 7900 XT 功耗和温度测试

FURMARK 烧机 TBP 功耗约 310W,GPU 温度是 67 度、Hot Spot 75.5 度、风扇转速 1735 RPM,GPU 频率可达 1948 MHz、记忆体 2487 MHz。

Time Spy EXTREME 烧机 TBP 功耗约 308W,GPU 温度是 66 度、Hot Spot 73.7 度、风扇转速 1753 RPM,GPU 频率可达 2393 MHz、记忆体 2487 MHz。

然后在整机功耗下,因为我们是使用 R9 7950X 测试,RX 7900 XTX 最高功耗约在 560W ~ 580W,RX 7900 XT 500W ~ 515W,所以建议使用 850W 电源供应器即可。

3DMARK 相关测试

3DMARK 测试,Time Spy、Time Spy Extreme、Fire strike、Fire strike Extreme、Fire strike Ultra,分数越高越好。

Port Royal 是世界上第一个针对游戏玩家的即时光线追踪基本测试,可以使用 Port Royal 来测试和比较支援微软 DirectX 光线追踪显示卡的光追性能,分数越高越好。

3DMark Speed Way 是 DirectX 12 Ultimate 基準测试,适用于执行 Windows 10 和 11 的游戏电脑。Speed Way 的引擎组合可展现 DirectX 12 Ultimate 为光线追蹤游戏带来的全新性能最佳化。Speed Way 使用如 Mesh Shaders 等的全新 DirectX 12 Ultimate 性能最佳化,并搭载用于即时全域照明和即时光线追蹤反射的 DirectX Raytracing Tier 1.1。

DirectX 12 的测试项目 Time Spy 支援 1440P 解析度、Time Spy Extreme 支援 2160P 解析度,DirectX 11 的测试项目 Fire strike、Fire strike Extreme、Fire strike Ultra,分别对应解析度是 1080P、1440P、2160P。

3DMark PCI Express 功能测试,可测量 GPU 的可用频宽速度。

UL Procyon benchmark

UL Procyon benchmark 是一套新上市的 Adobe Benchmark 标準化测试软体,可以分成照片和影片两方面的测试。照片影像运算方面的软体是使用 Adobe Lightroom Classic 和 Adobe Photoshop,影片运算应用是搭配 Adobe Premiere Pro。

游戏 AVG FPS & Low 1% 测试数据

游戏测试使用 4K 2160P 解析度,游戏特效皆设定最高 MAX,关闭 V-Sync 选项,主要运行 DX 12 优先。游戏都是经过 5 ~ 10 次测试后撷取 FPS 数据,会去检查是否有不正常数据存在,我们主要收集的数据是平均 AVG FPS 和 1% LOW FPS (min),1% Low FPS 可以看出游戏真实效能。

以下 2 个游戏有开启光线追蹤效果。

  • DiRT 5
  • Shadow of the Tomb Raider

Cyberpunk 2077 FSR 2 – AVG FPS & Low 1% 测试数据

游戏测试使用 4K 2160P 解析度,游戏特效皆设定最高 MAX,关闭 V-Sync 选项,主要运行 DX 12 优先。游戏都是经过 5 ~ 10 次测试后撷取 FPS 数据,会去检查是否有不正常数据存在,我们主要收集的数据是平均 AVG FPS 和 1% LOW FPS (min),1% Low FPS 可以看出游戏真实效能。

FSR 2.1 测试使用 Cyberpunk 2077 Benchmark,更新游戏 1.61 Patch 就可以开启,测试在 RX 7900 XTX、RX 7900 XT 下,关闭 FSR 2.1、开关光线追蹤,分别 FSR 2.1 设置 Ultra Performance、Performance、Blnce 和 Quality。 可以看到开启 FSR 2.1 后,在 Ultra Performance 设定下,可以提升 300% AVG FPS。

结论

RX 7900 XTX 和 RTX 4080 游戏对比,两者在无光线追蹤设定下表现接近,开启光线追蹤后,成绩就不是很理想,但是透过 FSR 2 技术后,可以看到 Cyberpunk 2077 在 4K 解析度下,搭配 FSR2 Ultra Performance 设定,RX 7900 XTX 平均 FPS 达到 81,RX 7900 XT 达到 76,这也意味着未来会有更大的进步,2023 即将登场的 FSR 3 一定可以带来更好的效能。

AMD Radeon RX 7900 XTX

AMD Radeon RX 7900 XT

延伸阅读

AMD 正式发表 RDNA 3 架构显示卡 Radeon RX 7900 XTX & Radeon RX 7900 XT