NVIDIA RTX 4090首发评测 DLSS3加持下加冕卡皇!

氪新抢先看

作者:氪新抢先看

发布于2022-10-11 21:03:06 +订阅

  在9月20日的GeForce Beyond活动中,NVIDIA CEO黄仁勋正式公布了RTX 40系显卡,其中旗舰级的RTX 4090率先登场,性能相比上一代旗舰RTX 3090Ti快2~4倍,他将其称为全世界最快的游戏GPU,那么NVIDIA GeForce RTX 4090的性能到底会有怎样的提升呢?

  近日,万众瞩目的NVIDIA 4090显卡终于揭开了它神秘的面纱,我们游侠硬件组也在第一时间拿到了一块NVIDIA GeForce RTX 4090 FE版本的GPU,下面就让我们来看看吧!

外观赏析

  本次的NVIDIA GeForce RTX 4090 FE版没有使用传统的套筒式包装设计,而是采用了设计感极强的等腰三角形布置。打开包装盒,RTX 4090揭开了它神秘的面纱。

  NVIDIA GeForce RTX 4090的正面与背面采用极简风格,这也彰显着这张公版旗舰显卡的大巧不工的外形设计理念。表面的散热装甲用料十足,装甲上的高光反射线条勾勒出一个数学无穷符号“∞”,科技感满满。

  显卡背面的散热鳍片从内部热管延伸至显卡表面,用料相当扎实,能够更快地将内部热量与外部进行传导。

  NVIDIA GeForce RTX 4090采用双面风扇设计,风扇下隐藏的格栅散热装置极富设计感。虽然外形仍然延续了上一代的设计,但这次的风扇尺寸有了显著的提升,这也进一步提高了散热装置的风压与进风量。值得一提的是,NVIDIA专门为这片风扇进行了静音设计优化,能够在显卡火力全开,风扇转速提升的同时依旧带来舒适的安静体验。

  此次全新登场的RTX 4090采用了新一代PCIe 5.0供电接口,在显卡侧面我们可以看到全新的12口供电接口插槽,相比于上一代,它在大大减少了插槽面积的同时提供了更大的供电功率,最大功率可达600W。随着内部流处理器与光追单元数量的暴增,NVIDIA GeForce RTX 4090的全卡功耗达到了450W,新一代的供电接口的使用为高端显卡的稳定运行提供了坚实的保障。

  NVIDIA GeForce RTX 4090显卡搭载了3个DP1.4a接口与1个HDMI2.1接口。DP1.4a支持60Hz+8K与120Hz+4K的分辨率规格,能够充分满足这张性能怪兽与高端显示器之间的数据传输需求。

  显卡侧面还分布着一个磁吸式金属贴片,取下贴片我们可以看到隐藏的连接机关。对于RTX4090这样的超高端旗舰,显卡在性能爆炸的同时也带来了较大的重量与尺寸,使用支架为主板与显卡带来更加稳固的连接,是一个值得考虑的选择,能够避免显卡重量较大引起的配件磨损与金属疲劳。

架构参数

  全新的RTX 40系列GPU均采用了NVIDIA最先进的ADA lovelace核心架构,我们的这张NVIDIA GeForce RTX 4090搭载了 AD102-300-A1核心,采用了台积电4N NVIDIA定制工艺打造,芯片面积达到了611mm²,拥有着恐怖的16384个CUDA核心!

  从GPU-Z上面来看,NVIDIA GeForce RTX 4090具有16384个着色单元、512个纹理映射单元和176个 ROP,完全支持DX12 Ulimited,而这款GPU的显存高达惊人的24GB!显存为GDDR6X规格,位宽达到了384Bit,频率为1313MHz,总带宽可达1TB以上!

  NVIDIA GeForce RTX 4090的基准频率为2235MHz,可Boost加速至2520MHz,接口为PCI -E 4.0×16规格,GPU功耗为450W

  新架构带来了更高效率的提升,新的128个SM单元可以达到比前代两倍的性能与功耗效率提升,比起RTX 30系列GPU,NVIDIA GeForce RTX 4090搭载了全新的第三代光追单元RT Core提升颇为可观,128个RT Core可提供强大的光线追踪加速,重新设计的引擎使得光线追踪性能提升了两倍,三角形交叉计算吞吐量也能相比RTX 30系列GPU的78 RT-TFLOPS上涨到191 RT-TFLOPS,提高程度达两倍以上!

  而全新的第四代Tensor Core更是能够为用户们提供更快的运算速度和AI能力,第四代Tensor Core的功能建立在Ada架构之上,它支持更多的数据类型处理,吞吐量比起前代能够增加一倍多,专为深度学习和AI推理工作加速而生,人工智能方面的性能也能提升一倍!最重要的是第四代Tensor Core与全新的DLSS 3共同呈现,凭借着Tensor Core的强大加速能力带来能够极大提高游戏体验的第三代DLSS 3,将会带来全新的游戏革命。

  DLSS3是极为强大的游戏技术,它在DLSS2的基础上增加了许多革命性的功能,DLSS3不仅可以通过AI生成更高的像素,还能通过光流加速器和帧生成器,在游戏中两个帧之间生成全新的帧!DLSS3还集成了有效降低延迟的Reflex技术,配合超分辨率以及帧生成,可以为玩家带来前所未有的流畅游戏体验!

  而对于创作者而言,NVIDIA GeForce RTX 4090搭载的第八代编码器(NVENC)也能极大提升创作者们的工作效率,支持AV1编码和双NVENC编码器,而全新的AV1编码模式相比H.264,能够大大提高渲染效率,平均速度可高出40%!在视频创作、3D渲染等方面事半功倍。

  在NVIDIA众多的合作伙伴中,有不少广大创作者们喜爱的视频编辑软件都会加入AV1编码格式,比如专业的工业级视频软件Davinci Reslove 18和Adobe Premiere Pro以及TikTok必备的剪映等软件,都将在十月的版本中加入对于NVIDIA  AV1编码器的支持,相信在RTX 40系列GPU强大的效率加持下,越来越多的生产力软件将会加入对于NVIDIA AV1编码器的支持。

基准测试

  我们使用3DMARK来进行NVIDIA GeForce RTX 4090的基准性能测试,一起来看看这个性能野兽到底能创下怎样的惊人成绩吧~

(测试平台如下)

  在考察DX 12渲染能力的Time SPY中,NVIDIA GeForce RTX 4090取得了夸张的32337分!比起RTX 3090Ti高出了近50%的分数!

  而在压力更大的Time SPY Extreme中,NVIDIA GeForce RTX 4090更是获得了17897分的好成绩,领先RTX 3090Ti近60%左右!这说明NVIDIA GeForce RTX 4090在DX 12渲染方面的提升是十分巨大的,分数差距极其明显。

  接下来是考验DX 11性能的FireStrike项目,NVIDIA GeForce RTX 4090同样成绩惊人,取得了74815分的极高分数,远远领先了RTX 3090Ti 约2万分!

  在压力更加大的FSE和FEU中,NVIDIA GeForce RTX 4090分别获得了39757和22833分,领先幅度相较于于上一代旗舰RTX 3090Ti同样达到了50%左右!

  从上面的测试中我们可以发现这一代的RTX 40系列提升幅度是十分巨大的,DX 11、DX 12中都有着近50%以上的巨幅加强,完全可以满足玩家极致的性能需求。

  由于NVIDIA GeForce RTX 4090使用了第三代RT Core核心,我们也对于它的光线追踪性能进行了测试,在实时光追测试Port Royal中,NVIDIA GeForce RTX 4090取得了超过两万分为23771分!比起RTX 3090Ti同样高出了50%以上!看来第三代RT Core也对于光线追踪有着极其不俗的优化升级,玩家们畅玩光线追踪游戏会更加得心应手。

游戏测试

  NVIDIA称GeForce RTX 4090为世界上最快的游戏GPU,这对于需要极高帧数来保障流畅游戏的玩家们来说是提升非常大的,接下来就一起看看GeForce RTX 4090的游戏帧数表现。

  在测试之前,我们要引入一个全新的测试概念,那就是—— 1% low FPS, 1% low FPS为一段时间内游戏帧数最小的百分之一部分的平均值,这个数据就会很直观的反映出游戏的流畅情况。

  玩家们在游玩游戏时,会遇到明明帧数看起来很高,但实际的游戏体验却时有卡顿的现象,这是因为PC在渲染游戏画面时的帧数生产不平稳,在一段时间内生成的帧数有多有少,综合下来将会出现“卡顿感”,这就会造成游戏体验非常糟糕,所以这就是为什么 1% low FPS非常重要的原因,只有 1% low FPS越接近平均帧数值,我们的游戏体验才会平滑稳定。

  NVIDIA官方的测试软件NVIDIA FrameView就是一款非常易于看出游戏实际体验的插件,NVIDIA FrameView可以测试出玩家实际游玩中的平均帧数、 1% low FPS以及PC的延迟情况,这些因素综合决定了我们游戏的顺滑程度。

DLSS3

  前面我们看过了NVIDIA GeForce RTX 4090全新的第四代Tensor Core,伴随Tensor Core而来的还有着先进的DLSS 3技术,这项技术基于第四代Tensor Core而生,DLSS 3是一项游戏革命性技术,它不仅保留了DLSS 2的特性,还增加了许多惊人的增强特性,为玩家游戏创造出绝佳的体验。

  传统的DLSS是基于AI的超分辨率技术,GPU根据低分辨率的画面,通过大量的人工智能模型训练来渲染出高分辨率的画面,利用AI加速预测图像的插值而生成更高分辨率的画面,以很小的性能渲染出高质量高帧率的游戏画面,DLSS2已经是极具革命性的技术了。

  但是DLSS 3在DLSS2的基础上更加优秀,它不仅可以从低分辨率渲染出高分辨率画面,还能使用AI渲染出全新的帧!也就是说传统的超分辨率只能渲染新的像素,而DLSS 3还将会生成全新的帧来保障游戏流畅!

  DLSS 3是由四个组件集成的,分别是全新的光流加速器、卷积自动AI编码帧生成器、游戏运动矢量引擎和Reflex低延迟管道,这四个组件组成了全新的DLSS 3技术。

  也就是说,DLSS 3通过RTX 40系列GPU上的第四代Tensor Cores加速,除了生成出更高分辨率画面之外,还能通过光流加速器预测前一帧和新帧之间的情况,从而生成全新的帧。

  而为了减少全新生成的帧造成的延迟问题,所以DLSS 3集成了解决延迟问题的Reflex技术,有效降低延迟,所以DLSS 3不仅能提高玩家的帧数,还能解决游戏过程中的延迟问题,可谓是一举两得!

  在NVIDIA GeForce RTX 4090发布初期,已经有不少游戏厂商和软件公司与NVIDIA合作了,所以我们拿到了几款带有DLSS 3全新特性的游戏和软件,下面就让我们一起来看看DLSS 3到底能够带来什么样的提升吧~!

  先来看看新版3D Mark的DLSS3测试,全新的3D Mark增加了对于DLSS3的支持,我们在4K分辨率下使用DLSS3“Performance”模式进行跑分,可以看到原生分辨率下的帧数为49帧,但是DLSS3可以使帧数翻三倍,达到了惊人的149帧!直接从不足60帧暴涨到100帧!DLSS3的性能提升令人非常震撼。

  而我们也测试了3D Mark 8K下的DLSS3,帧数居然从最开始的12帧暴涨到了82帧!帧数提升竟然达到了6~7倍,可见DLSS3强大的帧生成能够游戏玩家带来巨量的帧数提升。

  接下来我们要请出最近非常热门的开放世界游戏《赛博朋克2077》,这款游戏在光线追踪下的压力非常巨大,DLSS3能不能让我们以流畅的帧数游玩4K光线追踪呢?我们打开DLSS3,并且开启DLSS Frame Generation(光学多帧生成),开启这个选项后会自动开启Reflex功能,并且将DLSS Super Resolution调整为性能模式,DLSS 3就完全开启了。

  结果是非常令人惊喜的,我们在开启DLSS3后,游戏的帧数从45帧上涨了一倍多,突破了100帧畅玩!127帧非常流畅丝滑,配合高刷显示器畅玩4K光追,这在以前是不敢想象的事情。

  并且我们发现在 1% low FPS上,DLSS3也对于游戏体验有着巨大提升,我们打开DLSS3时 1% low FPS上涨到了100帧,这说明即使是最低的帧数部分也能满足高刷需求,玩家再也不用忍受 1% low FPS过低带来的画面不平滑问题,同时得益于DLSS3自带的Reflex,游戏的延迟从最开始的78ms降低了约一半,仅为40ms,这也就完美的避免了延迟过高的卡顿感,游戏操作也能更加得心应手,所以DLSS3给玩家带来的增益是全方位的提升。

  再让我们来看看玩家们关心的画质问题,DLSS3通过AI渲染出的高分辨率画面依然细节满满,对比关闭DLSS3,人物面部细节没有丢失,而衣服上的纹理依然清晰可见,并且由于是AI超分辨率到更高的16K,DLSS3的抗锯齿效果非常明显,难看的锯齿和狗牙都大幅减轻,使得画面更加清晰锐利了。

  而在另一款硬件杀手《微软模拟飞行》中,DLSS3同样可以给我们呈现惊人的性能提升,帧数从原来的87帧直接上涨到了159帧,帧数达到了翻倍,PC的延迟也有着很好的优化,总体非常令人满意。

  最重要的是, 1% low FPS从极低的23帧一跃上涨到了100帧以上,这对于流畅游戏的意义是非凡的,尤其是对于《微软模拟飞行》这种对于CPU依赖程度较高的游戏来说,DLSS3的渲染速度是CPU的两倍,所以玩家通过DLSS3技术可以轻松绕过CPU瓶颈,享受高帧率游戏乐趣。

  在国产开放世界武侠游戏大作《逆水寒》中,这款游戏是目前唯一拥有路径追踪和DLSS 3技术的游戏,我们先来欣赏一下《逆水寒》中路径光线追踪的魅力。

  对比开关RTX,我们可以很清晰的发现路径光线追踪带给我们的惊人提升,在鱼池中,开启路径光线追踪后的水面可以媲美现实,水面上也非常清晰的反映出了庭院景物的倒影,鲤鱼在水里的多次反射显得栩栩如生。

  开启路径光线追踪后,庭院的盆栽和门廊在水面的倒影极其逼真,并且午后的阳光在经过RTX ON后氛围感满满,长廊里的阴影也正确的体现了出来,路径光线追踪对于游戏画质的提升是翻天覆地的,RTX技术的确可以让玩家体验到身临其境的逼真虚拟世界!

  我们都知道路径追踪对于PC硬件的要求是非常高的,在开启4K光线追踪极高后,帧数仅为17帧,明显不能正常游玩了,但是开启DLSS3技术后,逆水寒的帧数直接变成了60帧以上!1% low FPS也从13帧不可用的状态暴涨至60帧,这已经完全可以流畅运行这款网游大作了,DLSS3在逆水寒中的性能提升达到了3倍多!

  而游戏的延迟更是从280下降到70,总体下降了四倍还多,满足了流畅游玩的标准,对比开关DLSS 3,我们发现人物皮肤边缘的锯齿在DLSS 3下大幅度减少,显得更为平滑,建筑物的纹理依然很好的保留了下来。

  备受好评的中世纪冒险类游戏续作《瘟疫传说:安魂曲》最近也加入了DLSS3技术,我们在这款游戏上也能获得惊人的帧数提升,可以看到在关闭DLSS3时,游戏的帧数勉强来到了60帧,而开启后帧数已经达到了144帧的高刷电竞水平!

  1% low FPS也从54帧上涨至140帧左右,延迟也明显的下降了,这种帧数水平完全可以称得上是电竞标准了,约三倍的性能提升增幅巨大,我们的NVIDIA GeForce RTX 4090面对最新的游戏也是完全不在话下。

  对比DLSS3的开关,人物的毛发细节也是很好的呈现了出来,衣服盔甲质感完全没有损失,与原生分辨率差别非常小。

  最后我们也测试了主流的游戏引擎对于DLSS3的支持情况,比较经典的Unity和火热的UE5引擎最近也在Demo中加入了对于DLSS3的支持,在Unity:Enemie的Demo中,开启DLSS3后的帧数从39帧直接提升两倍多达到92帧,1% low FPS更是从37帧上涨到75帧,最低帧也来到了60帧以上,延迟情况也得到了惊人的改善,从114ms降低了一半来到了52ms。

  而在UE5引擎的Lyra Demo中,DLSS3也能帮助我们将帧数提升两倍还多,从62帧飙升到了159帧,1% low FPS是质的提升,从47来到了150帧!

  DLSS3技术对于玩家来说是革命性的,它不仅可以大幅度的提升游戏的帧数,还能有效降低游戏时的延迟,为玩家提供清晰锐利的高帧数画面,所以DLSS3带来的游戏体验提升是全方位的。

  已经有多家游戏厂商与NVIDIA合作加入了DLSS3技术,目前已知超过35款游戏和应用即将宣布搭载DLSS3!如网游《逆水寒》“拂云庭”图形展示将于10月13日支持DLSS 3、《超级人类》(SUPER PEOPLE)抢先体验版将于10月12发布并支持DLSS 3、《生死轮回》(Loopmancer)将于10月12日发布更新并支持DLSS 3、更有《瘟疫传说:安魂曲》、《微软模拟飞行》等数款大作也将在近日开启DLSS3的支持,相信这项技术会在未来成为游戏大作的标配!

电竞游戏测试

  电竞游戏需要超高的帧数来保障我们的竞技状态,而 1% low FPS对于激烈的电竞游戏也是非常重要的,玩家在电子竞技中最怕的就是卡顿与延迟的情况出现,因为电竞游戏中是分秒必争的,细微的差异就会造成战局的变化,我们使用NVIDIA GeForce RTX 4090在电竞游戏中的体验就反映出了GPU强大的性能和帧生成流畅度。

  比如在FPS射击游戏《CSGO》中,游戏的帧数全程保持在250帧以上,激烈的射击游戏中帧数平稳是非常重要的,它可以保障我们的游戏对抗总能保持优势。

  《PUBG》在4K分辨率下可达到220帧的惊人平均帧, 1% low FPS也在188帧的高水平。

  而像是《APEX》和《星际战甲》等游戏里,平均帧数均在144FPS以上,完全达到了电竞水平,而 1% low FPS也总能保持在100FPS以上,游戏过程非常顺滑。我们还测试了NVIDIA Reflex功能,在《APEX》里Reflex还可以使得游戏的延迟有效从27降低到8ms。

  《彩虹六号》甚至可以达到4K分辨率下350帧以上的夸张帧数,最低帧287帧以上完全感受不到丝毫的卡顿,Reflex也能使得PC延迟有效下降到三分之一!

  最近推出的《守望先锋:归来》上线了,我们使用NVIDIA GeForce RTX 4090可以在4K 290帧左右畅玩, 1% low FPS也保持在245帧的高水平,画面丝滑流畅,开启NVIDIA Reflex后,延迟从18下降到极低的7ms,操作响应更快。

8K游戏大作

  NVIDIA GeForce RTX 4090拥有着恐怖的24GB GDDR6X显存,再加上惊人的16384个CDUA核心,那么8K游戏遇上这款GPU将会擦出怎样的火花呢?我们准备了几款游戏大作,开启极高的7,680 × 4,320(8K)分辨率,来对NVIDIA GeForce RTX 4090进行挑战。

  首先是卡普空的恐怖游戏大作《生化危机8》,我们开启8K分辨率+光线追踪全高后,游戏的帧数稳稳保持在60帧以上。

  同样最近的光线追踪大作《蜘蛛侠:重制版》在8K光线追踪下也可以60帧流畅运行,DLSS可使帧数提升两倍以上,稍微降低特效即可获得更为流畅的体验!我们对比开关光线追踪,效果非常明显,光追使得玻璃镜子上可以完整的反射出街道上的景物,行人、车辆、树木都非常清晰的反映在了玻璃上,而关闭光追则是朦胧一片,所以RTX技术可以让我们体验到身临其境的虚拟世界。

  《光明记忆:无限》通过DLSS在8K分辨率帧数提升高达三倍以上来到72帧!!

  《战地2042》能通过DLSS在战场中以66FPS畅玩8K光线追踪,使用DLSS也在《死亡循环》中获得了近两倍的帧数提升。

  《古墓丽影:暗影》中DLSS帮助我们在8K光线追踪的情况下帧数提升近三倍!90帧的8K光线追踪绝对是极为震撼的体验。

  而这些大作在4K分辨率+光线追踪全高的情况下几乎都可以运行在100帧以上,《古墓丽影:暗影》可达159帧,而《生化危机8》在不开启DLSS的情况下就已经突破190帧!

生产力性能

  RTX 40系列GPU搭载了全新的双编码器,搭配上自动分割帧的全新算法,可以使得RTX 40系列GPU比起RTX 30系列GPU的HEVC速度渲染快上两倍,已经有不少软件厂商和NVIDIA合作,比如Davinci 18 Reslove将会支持全新的RTX 40系列GPU加速以及AV1编码。

  我们拍摄了一些超高清的HDR的视频,对比NVIDIA GeForce RTX 4090以及NVIDIA GeForce RTX 3090Ti渲染编码HDR视频的速度,分别渲染H.264(AVC)以及H.265(HEVC)格式,结果是非常惊人的,NVIDIA GeForce RTX 4090比起RTX 3090Ti在H.264编码效率上快了一倍,而在8KHDR视频渲染中,H.265效率上RTX 4090更是比RTX 3090Ti快了两倍以上!生产力工作者可以大大减少等待时间,随心所欲的创作。

  而视频推流录制软件OBS也加入了对于NVENC的AV1编码录制支持,AV1格式是未来的视频编码趋势,相比于体积庞大的H.264和解码压力巨大的H.265格式,AV1格式不仅拥有着小巧的体积且易于解码编辑,还能保障视频的画质损失降低到最小,所以我们通过OBS软件的最新版录制了两段视频,一起来看看RTX 40系列的加持下AV1格式都有哪些优势吧~。

  对比H.264和AV1格式下的视频画质,我们发现AV1格式下的视频锯齿少了很多,角色手指部分边缘的锯齿在AV1格式下非常平滑,而H.264格式下明显可以看到手指边缘处的模糊和锯齿狗牙现象,不仅录制的视频清晰度上升一个档次,AV1文件的体积相比H.264也缩小很多,减少了用户的存储和编辑压力,可谓一举两得,所以NVENC全新的特性为生产力工作者带来了巨大便利,配合RTX 40系列GPU强大的加速能力,用户的创作效率更上一层楼!

总结

  经过测试后,我们认为GeForce RTX 4090在游戏领域已经是当之无愧的至尊卡皇,在比起上一代RTX 30系列性能巨幅提升的情况下,光线追踪性能和AI能力更加出色,先进的第四代Tensor Cores再搭配上革命性的游戏技术DLSS 3,使得GeForce RTX 4090迎战未来8K光线追踪大作成为现实,并且RTX 40系列GPU拥有极高效率的生产力创作能力,强大的CUDA核心以及全新的编码器让内容创作者也可事半功倍,达到了市面上其他竞品无法企及的全新高度,对于高端游戏发烧友和生产创作者来说,GeForce RTX 4090 必定会是工作和娱乐的最佳搭档!

  值得一提的是,本次NVIDIA将限量推出GeForce RTX 4090 FE版,于北京时间10月12日晚9点在京东首发上市,旨在为钟爱FE版设计的发烧级玩家带来无与伦比的体验。届时玩家可以选购来自NVIDIA FE版和来自顶级显卡供应商的RTX 4090 GPU标频版和超频版。

GeForce RTX 4090链接地址:传送门

分享到:

APP精彩推荐

相关资讯
热门资讯
下载APP可查看更多精彩资讯