NVIDIA GeForce RTX4090显卡评测(4K百帧)

  NVIDIA新一代Ada Lovelace GPU构架,首款旗舰卡后正式推出,不仅制程升级、时脉飞升,更带来Tensor Core与RT Core升级,以及新一代DLSS 3的AI补帧技术开启GPU加速大时代,同时具备AV1双编码引擎,不仅满足游戏玩家4K百帧的梦想,更是3D渲染、创作、模拟、运算上的专武神兵,让我们从构架、规格与性能来检视这新一代卡后的升级体验。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  这代NVIDIA改用TSMC 4N客制制程与Ada Lovelace微构架,让GPU可以拥有更多的SM单元,进一步的增加CUDA、Tensor Core与RT Core等数量,同时也让TMUs、ROPs等单元数量提升,再加上2.5GHz Boost的超高时脉,让RTX 4090可用2-4x倍快的性能超越RTX 3090 Ti。

  GeForce RTX 4090拥有着16384个CUDA核心、512个4代Tensor Core与128个3代RT Core,以及2.52 GHz Boost时脉与24GB GDDR6X內存,以超狂的规格同时满足专业创作、渲染与旗舰游戏玩家的需求。

  开箱

  Ada Lovelace卡后NVIDIA GeForce RTX 4090创始版,维持着Ampere世代开创的显卡美学新设计「背面即是正面」、「少但更好」GeForce。创始版采用坚固、耐用的铝合金打造X-Frame框架,表面采用阳极氧化处理带来高级的质感与金色的金属质感。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  而框架内则是填满散热鳍片,内部则是均温板替GPU、VRAM散热,再藉由热导管将废热引导至散热鳍片。而这代RTX 4090创始版采用更大的116mm、FDB、7扇叶的双风扇,并且增加显卡厚度至3-Slot、减少显卡长度至30.48cm(12 inch)。

  这代均温板也有着优化,并针对內存有着专属的切口,让均温板可以更均匀的与GPU接触,同时內存的导热垫则降低至1.5mm带来更好的热传导效应;这代散热器可支持到650W Qmax的解热能力。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  RTX 4090全面换上PCIe 12+4 Pin(12VHPWR)的供电界面,一线最高可传输600W的功耗外,也让新卡装机时整线可以更佳美观。当然创始版也提供了1条12VHPWR转4个PCIe 6+2pin的连接线。

  一般电源建议至少连接3个PCIe 6+2pin来转换,若是新买电源建议选择符合ATX12 V3.0与EPS12V V2.92规范的新电源,如此一来就可以将有点丑的冲天炮收起来,只要一条12VHPWR连接线即可提供显卡所需的供电。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  RTX 4090显示输出提供1个HDMI 2.1a支持VRR、4K120Hz / 8K60Hz HDR,以及3个DisplayPort 1.4a DSC支持12-bit 4K240Hz HDR / 12-bit 8K60Hz HDR等输出能力,最多同时连接4个屏幕输出。

  创作影音输出、GPU渲染性能测试

  此次测试包含创作Adobe premiere Pro 2020、DaVinci Resolve 18与Blender等创作测试,游戏则以2160p、1440p分辨率、特效全开测试电竞、AAA游戏与光追游戏的性能,并加入额外的DLSS 3前期测试,让玩家能全面了解RTX 4090为何强悍(这么贵)。

  比较性能的显卡分是NVIDIA GeForce RTX 3090创始版。

  测试平台

  处理器:Intel Core i9-12900K

  主板:ASRock Z690 PG Velocita

  內存:CORSAIR DOMINATOR PLATINUM RGB DDR5 32GBx2 5200MHz

  显卡:NVIDIA GeForce RTX 4090创始版、NVIDIA GeForce RTX 3090创始版

  系统碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD

  散热器:ASUS ROG STRIX LC II 280mm

  电源供应器:Seasonic PRIME PX-1000

  操作系统:Windows 11 Pro 21H2 64bit、Resizable BAR On

  驱动版本:NVIDIA 521.90

  GPU-Z已可检视NVIDIA GeForce RTX 4090信息,采用4nm制程的AD102 GPU,有着16384个渲染CUDA核心,以及24576 MB GDDR6X(Micron)內存,而GPU预设时脉2235 MHz、Boost 2520 MHz。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  这段测试分为两部分,第一段测试的项目使用4K Blackmagic RAW图像,并分别有着Wedding_Heavy_Styles时间轴,这段视频使用非常多的Resolve效果,像是OFX: Light Rays / Glow / Sketch等,输出相当高风格的影片类型。

  Bride_FaceRefine_Selective_Color则使用Face Refinement做人脸的追踪,并将主体新娘使用颜色凸显;50% Retime与Optical Flow–Enhanced Better都使用Optical Flow技术降低图像50%速度。

  SuperScale2x 4K Source使用4K ProRES来源视频制作2x Zoom In主体的4K视频输出;SuperScale4x HD_Source则是使用HD H.264来源视频,利用Resolve Super Scale输出成4K视频。

  这部分RTX 4090性能可说是非常突出,尤其在Optical Flow测试中节省了近2倍的输出时间,让创作者有着更快的输出性能。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  第二段测试为双NVENC编码的AV1与HEVC编码测试,测试项目是一段44秒的小短片,来至于Blender Open Movie Project《Tears of Steel》,并有着8k Prores442HQ 30FPS与4K Prores422HQ 30FPS的视频,可用来测试输出为HEVC、AV1编码的性能。

  输出设定主要是使用NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable等输出设定。

  性能上在4K30输出时RTX 4090性能与RTX 3090差异不大,但在处理8K输出时,RTX 4090的双编码引擎让HEVC输出时间加速了2x倍之多,而且AV1编码的速度也相当快,可见只要影音编辑软件支持RTX 40双编码引擎,即可获得相当出色的编码性能成长。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  Adobe Premiere Pro 2022影音剪辑软件,采用自家开发的Mercury Playback Engine GPU加速,可借助GPU的编码引擎加速图像输出速度。测试使用的项目1为公司1080p60fps的开箱视频;而BigMix4K项目其采用3段FinalAdjusted_MPE 1920×1080的图像组成一段4K时间轴,进行H.264、HEVC格式输出。

  (测试的Premiere Pro 2022还未支持RTX 4090双编码功能。)

  性能上RTX 4090依旧能有着比RTX 3090还要快的输出速度,但不像支持的DaVinci Resolve可以有着惊人的输出时间缩短。因此,这测试主要提供给各位参考。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  Blender是跨平台、开放源码的3D创作工具,支持着各种3D作业:Modeling、Rigging、Animation、Simulation、Rendering、Compositing与Motion Tracking等。而测试,则以Blender Benchmark 3.3.0进行Demo项目的渲染工作测试。

  Blender Benchmark 3.3.0测试,可见RTX 4090在3个场景的每分钟Sample数量(性能)高于RTX 3090约两倍之多,展现出Ada Lovelace的3D创作实力。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  3DMark跑分性能测试

  3DMark Fire Strike性能测试,为主流的DirectX 11 API的测试情境,分别测试1080p、Extreme 1440p与Ultra 2160p的性能。

  RTX 4090让Fire Strike达到54174分的成绩,而从Ultra Graphics的成绩比起RTX 3090快了2x倍的性能提升,而Extreme则是1.8x倍、FHD 1.6x倍。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  3DMark Time Spy则是采用DirectX 12 API所设计的测试情境,同样是锁定在AAA游戏等级,分别测试1440p与Extreme 2160p的性能。

  RTX 4090在Time Spy达到32638分的总成绩,比起RTX 3090分别有着1.8x、1.9x倍的性能提升。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  针对光线追踪测试,3DMark Port Royal在AAA游戏中的场景中加入光线追踪功能,考验着新一代GPU对于硬件光线追踪加速的能力。同时DXR测试,则是使用DirectX Raytracing API进行的功能测试。

  RTX 4090即便不用DLSS也能有着相当惊人的光追性能,Port Royal达到119 FPS、DXR 138 FPS的成绩,对比RTX 3090同样带来1.95x、2.44x倍的性能提升。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  3DMark DLSS Feature Test可针对DLSS 3、DLSS 2进行性能测试,设定为3840 x 2160、Performance加速下,RTX 4090在DLSS 2可获得138 FPS / 2.3x倍的性能提升,DLSS 3使用AI产生画面后可达到193 FPS / 3.3x倍的性能提升。

  后续会使用游戏来实测DLSS 3的性能表现。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  4款电竞游戏性能测试

  4款电竞游戏:《虹彩六号:围攻行动》、《英雄联盟》、《APEX英雄》与《CS:GO》等,都是重技巧、团队的战术竞技射击、DOTA类型的游戏,因此游戏画质、细节不高的状况下,游戏FPS也都是平均百帧以上的表现。测试以2160p、1440p、特效最高设定进行。

  对于电竞游戏来说RTX 4090带来的性能增长并不明显,毕竟RTX 3090在2160p也能提供电竞游戏相当强的性能,测试中仅《虹彩六号:围攻行动》有着较明显的性能提升,其余3款则是相对接近。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  11款游戏性能测试

  11款AAA游戏平均性能,同样测试2160p、1440p、特效全开进行测试,这段测试仅F1使用光追,其余游戏无光追下、无DLSS加速,测试GPU的实际传统渲染游戏性能。

  游戏测试名单有入门的《F1 2021》、《极限竞速地平线5》赛车游戏、《古墓奇兵:暗影》、电影游戏《死亡搁浅》、《战争机器5》、《全境封锁2》、《地平线:期待黎明》,以及吃重性能的《边缘禁地3》、《刺客教条:维京纪元》、《碧血狂杀2》与《战神》等测试。

  RTX 4090在2160p、AAA游戏当中有着相当不错的性能提升,11款游戏平均达148 FPS,比起RTX 3090平均89 FPS,可达到平均约1.7x倍的性能升级。

  但在1440p分辨率下则是RTX 4090平均200 FPS、RTX 3090平均143 FPS约1.4x倍性能提升。

  可见RTX 4090在主力2160p分辨率下,不靠着DLSS加速即可带给玩家约1.7x倍的性能提升,若以百分比表现则是有着平均66%的性能升级。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  9款光追游戏测试

  9款光追DXR游戏测试,则使用最热门的《电驭叛客2077》、《控制》、《看门狗:自由军团》、《战栗深邃:流亡》、《漫威蜘蛛人重制版》、《漫威星际异攻队》、《鬼线:东京》、《极地战嚎6》与《恶灵古堡村庄》等游戏进行测试。测试2160P、1440p分辨率,特效/光追最高设定外,也会启用DLSS加速,详细设定请参考图表说明。

  RTX 4090在《电驭叛客2077》DLSS 2加速下可达到平均110 FPS,比起RTX 3090平均60 FPS还要高出许多;同样在《控制》与《鬼线:东京》等光追游戏上,都能感受到RTX 4090所带来的强劲光追游戏性能升级。

  RTX 4090在2160p、9款光追游戏测试下平均可达132.3 FPS,相较于RTX 3090则有着平均82 FPS,光追游戏性能提升约在1.6x倍、平均65%的升级量。

  至于1440p则是,RTX 4090平均169 FPS、RTX 3090平均119.8 FPS,约1.4x倍、41%性能提升。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  功耗与温度测量

  显卡的功耗与温度测试,使用Time Spy Stress test与《电驭叛客2077》进行测试。功耗测量时使用NVIDIA提供的PACT工具,可监控PCIe插槽与电源12V提供的瓦数。

  显卡温度方面,RTX 4090创始版在压力测试最高温维持在67.8°C,至于2077游戏时温度则会稍微降低65°C,而比较的RTX 3090创始版则有改过导热垫,因此温度表现相当。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  显卡TBP功耗测试,在Time Spy Stress test时RTX 4090平均都达到390W的功耗、瞬时最高462W,而2077游戏时则是平均358W、瞬时398W的功耗表现。

  RTX 4090使用Furmark Xtreme burn-in最高可来到平均458W的功耗,这也是NVIDIA预设的功耗上限,若是品牌自制卡带超频的状况下应该也会在500W左右,除非使用2个12VHPWR供电。

NVIDIA GeForce RTX4090显卡评测(4K百帧)

  总结

  NVIDIA GeForce RTX 4090再次用实力超越以前的自己,在双NVENC的加速下让DaVinci Resolve 18有着更快的影音输出性能,以及支持新一代AV1编码功能,这将成为RTX 40系列的标配,而3D创作性能Blender、V-Ray都有着近2x倍的性能升级,这无疑是创作最强的专武。

  游戏性能方面,再次制霸2160p、4K的AAA、光追游戏性能,AAA游戏平均1.7x倍提升、光追游戏平均1.6x倍升级,倘若DLSS 3普及AI补帧可带来平均2.95x倍加速,满足玩家4K100fps百帧的梦想,无疑是外挂级的游戏神兵。

  DLSS 3目前公布的游戏有达35款(含程序)支持,但每款游戏的释出、更新时间不同,因此需要等待一点时间让新技术普及。

  而这代有着近乎2x倍的性能升级,更可预期未来RTX 4080的表现依旧亮眼,但相对的2x倍性能提升下,RTX 4090价位相比RTX 3090可说划算,但是RTX 4080价位跟着提高的状况下,不知各位玩家有多少预算来追求这极致的性能?尤其未来主流RTX 4060,能否切中玩家的期待与价格的甜蜜,这就要看NVIDIA如何盘算了。

  4K百帧不是梦,因为我是NVIDIA GeForce RTX 4090。