在9月20日的GeForce Beyond活动中,NVIDIA CEO黄仁勋先生正式公布了RTX 40系显卡,我们在前期已经测试过了旗舰级别的GeForce RTX 4090 GPU,其强大的性能一骑绝尘,而到了十一月,NVIDIA的次旗舰GeForce RTX 4080终于也是来到了玩家的面前,游侠网已经收到了这块GPU,相信有不少小伙伴已经迫不及待的想要知道GeForce RTX 4080的性能表现了,我们就通过NVIDIA GeForce RTX 4080 FE版本的GPU来一探究竟吧~
外观欣赏
本次的NVIDIA GeForce RTX 4080 FE版依然采用了GeForce RTX 4090的包装设计,包装盒为科技感非常强的的等腰三角形布置。打开包装盒,GeForce RTX 4080 FE揭开了它神秘的面纱。
NVIDIA GeForce RTX 4080 FE的正面与背面采用极简风格,这也彰显着这张公版旗舰显卡的大巧不工的外形设计理念。表面的散热装甲用料十足,装甲上的高光反射线条勾勒出一个数学无穷符号“∞”,科技感满满。
显卡背面的散热鳍片从内部热管延伸至显卡表面,散热片的用料相当扎实,能够更快地将内部热量与外部进行传导。
NVIDIA GeForce RTX 4080 FE依然采用了双面风扇设计,风扇下隐藏的格栅散热装置极富设计感。虽然外形仍然延续了上一代的设计,但这次的风扇尺寸有了显著的提升,这也进一步提高了散热装置的风压与进风量。值得一提的是,NVIDIA专门为这片风扇进行了静音设计优化,即使是满载运行也可以毫无压力,风扇转速提升的同时为玩家带来舒适安静的游戏体验。
此次全新登场的RTX 4080采用了新一代PCIe 5.0供电接口,在显卡侧面我们可以看到全新的16Pin供电接口,相比于上一代,大大减少了插槽面积的同时提供了更大的供电功率,最大功率可达600W。得益于TSMC 4N NVIDIA 定制工艺的加持,这一代的RTX 40系列GPU能耗比进一步提高,NVIDIA GeForce RTX 4080 FE的TGP达到了320W,新一代的供电接口的使用为高端显卡的稳定运行提供了坚实的保障。
搭载了3个DP1.4a接口与1个HDMI2.1接口,带宽最高可达48GB/S。最高可支持60Hz+8K与120Hz+4K的分辨率规格,完全可以迎战未来的高分辨高刷新率显示器,能够充分满足这张性能怪兽与高端显示器之间的数据传输需求。
显卡侧面还分布着一个磁吸式金属贴片,取下贴片我们可以看到隐藏的连接机关。对于RTX 4080这样的高端旗舰GPU来说,显卡在性能爆炸的同时也带来了较大的重量与尺寸,使用支架为主板与显卡带来更加稳固的连接,是一个值得考虑的选择,能够避免显卡重量较大引起的配件磨损与金属疲劳。
参数架构
NVIDIA GeForce RTX 4080 FE 16GB拥有着高达9728 个 CUDA 核心,能够带来多达49 Shader-TFLOPS 传统光栅渲染能力,304 个第四代 Tensor Cores可以为AI加速和DLSS带来巨量加速,性能幅度达到了780Tensor-TFLOPS ,而76 个第三代 RT Cores可以以113 RT-TFLOPS的速度迎战未来光线追踪。
在GPU-Z上面显示,NVIDIA GeForce RTX 4080 FE 16GB带有16GB的GDDR6X镁光高速显存,显存位宽为256Bit,总带宽可达716GB/S,GPU默认频率为2205MHz,可加速至2505MHz,显存频率为1400MHz。
NVIDIA GeForce RTX 4080 FE 16GB的游戏性能获得了巨量的提升,在最新的游戏中相比上一代的RTX 3080 Ti高出一倍!
比起RTX 30系列GPU,NVIDIA GeForce RTX 4080 FE搭载了全新的第三代光追单元RT Core,提升十分惊人,76个RT Core可提供强大的光线追踪加速,重新设计的引擎使得光线追踪性能提升了两倍,三角形交叉计算吞吐量也能相比RTX 30系列GPU提高程度最多可达两倍以上!
而全新的第四代Tensor Core更是能够为用户们提供更快的运算速度和AI能力,第四代Tensor Core的功能建立在Ada架构之上,它支持更多的数据类型处理,吞吐量比起前代能够增加一倍多,专为深度学习和AI推理工作加速而生,人工智能方面的性能也能提升一倍!最重要的是第四代Tensor Core与全新的DLSS 3共同呈现,凭借着Tensor Core的强大加速能力带来能够极大提高游戏体验的第三代DLSS 3,将会带来全新的游戏革命。
DLSS 3是一项革命性的游戏技术,它保留了DLSS 2的基础,但是DLSS 3不仅可以通过AI生成更高的像素,还能通过光流加速器和帧生成器,在游戏内的两个帧之间生成全新帧!不仅如此,DLSS 3还集成了有效降低延迟的Reflex技术,配合超分辨率技术以及帧生成技术,将会带领玩家进入前所未有的丝滑游戏世界!
而对于创作者而言,NVIDIA GeForce RTX 4090搭载的第八代编码器(NVENC)也能极大提升创作者们的工作效率,支持AV1编码和双NVENC编码器可将视频导出时间缩短一半!而全新的AV1编码模式相比H.264,大大的提高了渲染效率,平均速度可高出40%!在视频创作以及3D渲染等领域保持更加稳固的统治力。
专业的工业级视频编辑软件Davinci Reslove 18和Adobe 公司旗下的Premiere Pro、推流软件OBS以及抖音出品的热门剪辑软件剪映等,都已经支持了NVIDIA AV1编码器,目前AV1已经成为未来的视频推流编码的趋势,在RTX 40系列GPU强大的效率加持下,越来越多的生产力软件将会加入对于NVIDIA AV1编码器的支持,以便于用户迎战未来影音需求。
理论性能测试
为了能够更好的发挥RTX 40系列GPU的性能,我们使用了Intel酷睿i9-13900K和Windows 11系统进行测试,具体的测试平台如下图所示。
在全球玩家最信任的硬件检测软件3D MARK中,我们对于NVIDIA GeForce RTX 4080 FE进行了全方位的性能测试,一起看看看这款GPU的性能有没有达到你的预期吧~
在考验GPU在DX 12渲染性能的TimeSpy中,我们的NVIDIA GeForce RTX 4080 FE取得了28012分的成绩,比起RTX 3080 Ti高出了近40%的分数!
而在4K分辨率下的TimeSpy Extreme中,NVIDIA GeForce RTX 4080 FE也获得了14010分的好成绩,同样比起RTX 3080Ti高出了近40%!
而在代表着DX11渲染性能的FireStrike中,NVIDIA GeForce RTX 4080 FE的表现依然不俗,获得了61776分的高分,比起上一代的RTX 3080Ti高出35%以上!
压力较大的FSE和FSU中,NVIDIA GeForce RTX 4080 FE获得了33288和17210分的高分水准,保持着碾压上一代RTX 3080Ti的良好势头。
NVIDIA GeForce RTX 4090使用了第三代RT Core核心,那么它的光线追踪实力有没有巨大提升呢?我们也对于它的光线追踪性能进行了测试,在3D Mark的实时光追测试Port Royal中。NVIDIA GeForce RTX 4080 FE获得了17861分的总分,比起RTX 3080Ti强于35%左右,看来第三代RT Core的性能还是十分值得称赞的。
游戏实测
对于玩家在游戏时实际的流畅度体验,我们就不得不重视1% low FPS, 1% low FPS即为一段时间内游戏帧数最小的百分之一部分的平均值,1% low FPS也代表着游戏时实际流畅程度的标准。
玩家在游玩游戏时可能时不时会感觉到卡顿现象,那为什么游戏的帧数却显示的很高呢?这是因为1% low FPS非常的低,在一段时间内游戏帧数突然从高帧数掉落到低帧数,过大的帧数反差会令玩家游玩体验很差,所以只有1% low FPS达到了流畅的水平,游戏的卡顿现象就会大大减少,玩家的游戏体验才会丝滑流畅。
NVIDIA官方的测试软件NVIDIA FrameView 1.4是一款度量玩家游戏实际体验的插件,NVIDIA FrameView可以测试出玩家实际游玩中的平均帧数、 1% low FPS以及PC的延迟,这些因素综合起来决定了我们游戏的顺滑程度。
DLSS 3
NVIDIA GeForce RTX 4080 FE搭载了NVIDIA研发的全新第四代Tensor Core,基于第四代Tensor Core而生的DLSS 3就成为了提升玩家游戏体验的重要武器,DLSS 3是一项游戏界的革命性技术,它不仅保留了DLSS 2的特性,还增加了创新性的帧生成技术,这是NVIDIA在游戏AI领域的开创性创新。
传统的DLSS 2技术基于AI的超分辨率技术,GPU根据低分辨率的画面,通过大量的人工智能模型训练来渲染出高分辨率的画面,利用AI加速预测图像的插值而生成更高分辨率的画面,牺牲小部分的性能来渲染出高质量高帧率的游戏画面。
DLSS 3在DLSS 2的基础上作出了重大革新,它不仅可以通过低像素渲染出高像素,还可以通过AI直接生成全新的帧!这样可以使得游戏帧数更高更加流畅。DLSS 3有三个重要功能,光学帧生成技术、超级分辨率和NVIDIA Reflex,并且DLSS 3也完全支持传统的DLSS 2。
要实现如此惊人的技术就少不了完善的组件,DLSS 3的组成分为四个部分,分别是全新的光流加速器、卷积自动AI编码帧生成器、游戏运动矢量引擎和Reflex低延迟技术。
光流加速器和运动矢量引擎加速了AI帧生成的速度,大大减少了帧生成时间,而Reflex技术则可以进一步降低玩家游戏中的延迟,所以DLSS 3可以提供高帧数高质量低延迟的极佳游戏体验!
截止到GeForce RTX 4080发布,目前已经有10款游戏正式支持了DLSS 3技术,比如最近大受好评的剧情游戏《瘟疫传说:安魂曲》(A Plague Tale: Requiem),国产射击类大作《光明记忆:无限》(Bright Memory: Infinite),新推出的《毁灭全人类2:重新探测》(Destroy All Humans! 2 - Reprobed),口碑良好的国产恶魔城类游戏《暗影火炬城》(F.I.S.T.: Forged in Shadow Torch),热门的赛车游戏F1 ® 22、网易武侠大作《逆水寒》(Justice)、国产动作大作《生死轮回》(Loopmancer)以及《漫威蜘蛛侠:重制版》 (Marvel’s Spider-Man Remastered),经典的《微软模拟飞行》(Microsoft Flight Simulator )和《超级人类》(SUPER PEOPLE)共十款都将会加入DLSS 3技术的支持,在DLSS 3的加持下,玩家可以更流畅丝滑的享受到大作乐趣。
先来看看3D Mark最近更新的DLSS 3测试,我们调整测试为4K分辨率光线追踪,可以看到在没有开启DLSS 3之前,帧数仅为39帧,但是DLSS 3可以帮助我们把帧数提高到132帧!整整高了两倍还多!
国产科幻开放世界大作《幻塔》最近也加入了DLSS 3和光线追踪的支持,极高画质开启4K光追之后,游戏的帧数达不到60帧的要求,但是DLSS 3可以帮助我们把帧数提升到丝滑的152帧!提升幅度高达两倍以上! 1% low FPS也从47帧提高到了127帧,不仅如此,游戏的延迟也从80ms直接下降到了31ms,我们释放技能时机更加准确,操作也更加流畅。
幻塔的光线追踪效果是十分明显的,开启光追后椅子上的人物清晰的反射到了地板上,建筑物和灯光的反射也更加精准清晰,人物阴影的轮廓极大的提高了准确度,幻塔的光线追踪带来的画面提升是非常优秀的。
对比开关DLSS 3的画面,我们可以发现并没有出现伪影和模糊现象,人物和衣服的细节得到了很好的保留,DLSS 3依然可以为玩家提供清晰锐利的游戏画面。
而最近大受好评的剧情类游戏《瘟疫传说:安魂曲》首发便加入了DLSS 3技术,我们在4K最高画质下为59帧,而开启DLSS 3后帧数同样达到了原生的三倍!最低帧也跟着翻了三倍,这时的游戏体验无比流畅,沉浸感十足。
对比开关DLSS 3,人物的头发丝细节依然清晰,衣服的纹理也纤毫毕现,强大的AI渲染出的画面完全可以媲美原生!
《暗影火炬城》和《生死轮回》是两个优秀的国产动作游戏,这两个游戏都支持光线追踪技术,他们也与NVIDIA深度合作加入了DLSS 3阵营,《暗影火炬城》在4K光线追踪超高下帧数从78帧提高到了179帧!整整多了一百帧!《生死轮回》的帧数也从54帧达到了不错的130帧,并且二者的游戏延迟均下降了一倍,这对于动作游戏来说是体验非常好的,玩家可以轻松打出复杂的连招,杀敌也更加畅快。
在《生死轮回》中,我们开启光线追踪可以看到地板上面的反射非常真实,人物和场景都被清晰的反射了出来,足球和桌子清晰可辨,仿佛置身于真实的赛博世界。
这款游戏对于DLSS 3的支持也非常不错,我们发现开启DLSS 3后画面会更加的清晰,人物的细节也更锐利了,效果非常值得称赞。
国产射击游戏大作《光明记忆:无限》最近也加入了DLSS 3技术的支持,我们在4K光追的情况下原生为79帧,开启DLSS 3 性能后直接帧数翻倍, 1% low FPS也达到了120FPS的高水平,延迟整整降低一半,可以获得媲美电竞游戏般的爽快射击体验。
对比开关DLSS 3的画面情况,可以看到木箱上面的文字依旧很清晰,木箱的纹理细节和原生几乎无差别,画面依然清晰锐利。
最新发售的《毁灭全人类2:》也支持了DLSS 3技术,帧数可提高1.5倍以上达到177帧,最重要的是最低帧直接提升了一倍,这对于射击体验是非常友好的。
《赛博朋克2077》通过DLSS 3获得了三倍以上的性能提升!从28帧直接来到了一百帧,这个提升幅度可以说是十分巨量的,延迟也从127ms大幅降低到40ms左右,游玩体验上升了好几个档次!
微软模拟飞行的提升也非常惊喜,从64帧提高到150FPS以上,幅度惊人。
总的来说,对比上一代RTX 3080 Ti+DLSS 2,RTX 4080+DLSS 3的提升幅度是极其巨大的,像是《赛博朋克2077》、《微软模拟飞行》和《瘟疫传说:安魂曲》等大作,都比起上一代高出了近一倍的帧数!《微软模拟飞行》直接相比上一代高出了100帧左右!其他的光线追踪大作也有着近50%以上的海量提升,提升幅度无疑是十分惊人的。
DLSS 2和光线追踪大作
NVIDIA GeForce RTX 4080 FE配备了第三代RT Core,可以带来相比上一代GPU高达两倍以上的光线追踪性能表现,我们也测试了几款比较考验GPU性能的光线追踪大作,NVIDIA GeForce RTX 4080 FE得出的成绩依然让人十分满意。
可以看到在4K分辨率+DLSS 2性能模式下,这几款大作在DLSS 2的加持下都可以做到4K@100FPS以上,《古墓丽影:暗影》更是可以在4K光线追踪+DLSS 2性能模式下达到超高的185帧!最新的《哥谭骑士》也可以近100帧流畅光线追踪运行。
纯光追游戏《地铁:离去增强版》可以说完全释放出来了RTX 4080的第三代RT Core的优势,在RT Core和Tensor Core的强力支持下也能以140帧的电竞帧率游玩,总体来说NVIDIA GeForce RTX 4080 FE完全可以在4K分辨率利用DLSS 2挑战各类光线追踪大作了。
而在2K分辨率+DLSS 2质量模式下,我们的NVIDIA GeForce RTX 4080 FE就表现得更加游刃有余了,即使没有DLSS的《生化危机8》和《光环:无限》都达到了惊人的250FPS!古墓丽影和COD19也能运行在200FPS以上,《战地2042》可以在开启光线追踪的情况下150帧流畅运行,2K分辨率对于NVIDIA GeForce RTX 4080 FE来说已经是非常轻松了。
Reflex游戏测试
相信也有着不少电竞玩家也需要购买RTX 40系列GPU,那么我们的NVIDIA GeForce RTX 4080 FE在电竞游戏都有着什么样的表现呢?
我们直接将分辨率设置为4K,画质调整为极高,即使是在画质拉满的情况下,我们的NVIDIA GeForce RTX 4080 FE依然能够丝滑运行这些电竞游戏,并且在NVIDIA Reflex技术的加持下,我们的游戏延迟变得很低,这对于分秒必争的电竞玩家来说是十分有必要的,在电子竞技中,比对手的延迟更低就意味着我们可以更快的做出反应,操作更为精准,也许一瞬间的优势就能帮助我们在战场中逆转局势。
在《守望先锋》“归来”里,NVIDIA GeForce RTX 4080 FE能够在4K分辨率下以224帧的超高帧数运行,1% low FPS也在180FPS以上,这时的画面非常丝滑,再加速NVIDIA Reflex技术的加持下,我们的PC延迟从23ms下降到了个位数,整整低了一倍还要多!
而战术竞技类游戏《彩虹六号》更为夸张,我们可以以接近300帧的帧率游玩!开启Reflex后延迟更是缩减到了约三分之一水平。
最近爆火的年货游戏《COD19》性能表现依然强劲,4K下170帧以上运行无压力,1% low FPS150帧以上表现优秀,并且游戏也集成了Reflex技术,开启后就可以达到仅9ms的延迟!
永劫无间和APEX也可以轻松电竞165Hz帧数游玩,Reflex技术成功的将延迟下降了一半以上!看来NVIDIA GeForce RTX 4080 FE是非常适合电竞玩家的,不仅能享受到高帧率的电竞体验,并且PC的延迟大大降低,再也不怕因为反应慢而丢失好局了!
生产力性能测试
RTX 40系列GPU搭载了全新的双编码器,可以使得RTX 40系列GPU比起RTX 30系列GPU的HEVC速度渲染快上两倍,已经有不少软件厂商和NVIDIA合作,如Davinci 18 Reslove和剪映PRO就已经支持了全新的RTX 40系列GPU加速以及AV1编码。
我们使用索尼A7M4拍摄了一段4K分辨率10bit 422 H265格式编码的视频,调色剪辑后使用NVIDIA GeForce RTX 4080 FE在达芬奇里渲染导出,结果可以看出RTX 40系列的NVENC双编码器相比上一代的提升是十分显著的,最高可以缩短一半的渲染时间!
玩家们常用的视频推流软件OBS也加入了对于新一代NVENC和AV1编码的支持,我们分别用AV1和H264格式录制相同的游戏场景,一起来看看和传统的H.246都有什么样的区别吧~
我们在剪映专业版剪辑AV1格式的视频并且在NVIDIA ICAT里比较与传统H264格式的区别,可以看到AV1编码下的画面质量非常清晰锐利,相比H264格式少了很多锯齿,人物的细节也更加的丰富,最重要的是,同样游戏场景的录制,AV1格式的视频相比H264格式少了三分之一以上,这就是AV1编码的优势,未来也会有更多厂商愿意使用AV1作为首要的编码格式。
功耗温度
相信许多小伙伴们除了知道RTX 4080TGP 拥有的320W功耗墙,都比较关心NVIDIA GeForce RTX 4080 FE的实际使用时的功耗情况,我们测试了几项有代表性的日常软件和实际游戏时GPU的功耗表现。
我们使用了NVIDIA FrameView软件来记录,NVIDIA FrameView可以准确的记录GPU在一段时间内的平均功耗情况,只需应用内开启后即可完整记录,一起来看看它的功耗表现如何吧~
从结果来看,这一代的RTX 40系列GPU功耗表现是十分优秀的,游玩2K分辨率极高画质的《守望先锋》“归来”仅需140W的功耗,即使是4K分辨率极高画质的《PUBG》也不到300W,而开启光追全特效和DLSS 3性能模式之后的《生死轮回》仅需233W的平均功耗即可流畅游玩,使用图片编辑软件LightRoom时,GPU功耗达到了极低的15W ,并且我们全程的实际测试温度也不会超高60℃,散热水平非常优秀。
这说明了采用全新工艺后,RTX 40系列GPU拥有了更强大的能耗比表现,在比上一代RTX 30系列GPU性能增强的同时,功耗却大大的降低,在TSMC 4N工艺制程和新架构的加持下,只需更少的功耗即可做到更强性能,更加省电清凉了。
总结下来,这一代的RTX 40系列GPU是带给我们非常多的惊喜的,NVIDIA GeForce RTX 4080 FE不仅在DLSS 3的加持下畅玩4K光线追踪大作,游戏性能进一步暴涨,并且NVENC的双编码器效率大幅提升,在生产力项目中也有着得天独厚的优势,TSMC 4N工艺也使得能耗比表现亮眼,使得NVIDIA GeForce RTX 4080 FE成为了高端玩家和生产力用户不可多得的一款高效利器。
并且这次NVIDIA GeForce RTX 4080 FE的定价在9499元,相比RTX 3090的首发价11999元,RTX 4080在性能大幅度强于前代旗舰的基础上价格却低出不少,性价比非常亮眼,只需不到10000元就能享受到4K光追和DLSS 3以及全新的AV1双编码器等诸多黑科技,反观AMD最新发布的RX 7900XT,在软硬件层面的创新力度不大,并没有RTX 40系列搭载的DLSS 3和AV1双编码器这样对用户提升比较大的革新,性能相比上一代RX 6950XT的增幅也不容乐观,所以在DIY装机市场复苏的时期,我们相信RTX 40系列GPU会带给我们更多游戏和工作上的高效支持!