AI加速全面升级:影驰RTX 4070 Ti SUPER 大将OC评测

氪新抢先看

作者:氪新抢先看

发布于2024-01-25 14:59:47 +订阅

      RTX 40 SUPER系列显卡凭借着RTX 4070 SUPER打响了极具竞争力的开门红,这也让我们对后续的RTX 4070 Ti SUPER期待满满。与RTX 4070 SUPER和RTX 4080 SUPER不同,RTX 4070 Ti SUPER的核心从AD104替换为更上位的AD103,在规格提升上相当显著。本次我们拿到的这张来自国产板卡大厂影驰GALAX的GeForce RTX 4070 Ti SUPER 大将OC显卡属于主打性价比的大众产品线,接下来就来看看它的表现究竟如何吧。

外观

      影驰GeForce RTX 4070 Ti SUPER 大将OC显卡的外包装采用了游戏硬件中常见的充满金属色彩的五角星图案作为主基调,影驰的LOGO、三年质保与个人送保标志以及下方产品型号与特性的标注十分清晰。

      拿出显卡,整卡的外观设计以黑色为主色调,通过线条勾勒出的装饰风格也充满力量与科技感,相信能够受到很多游戏玩家的喜欢。在散热系统方面,影驰星烽散热系统是针对RTX 40 SUPER家族全新设计的散热系统,通过多维度散热体系与核心、显存、供电全覆盖的散热设计,使显卡在长期高负载的游戏、GPGPU与AIGC等应用场景中保持高效稳定。正面的三个92mm定制静霜风扇支持智能启停,在待机、日常办公等轻度场景中能够显著降低整机噪音,提升使用体验。

      从顶部看去,除了PCIe 5.0 12VHPWR高性能供电接口与ARGB同步线接口之外,密密麻麻的散热鳍片能够有效提升散热系统与空气的接触面积,搭配通过回流焊技术连接的8根6mm复合热管,能够快速降低显卡的温度。同时,显卡右侧的GALAX品牌LOGO也带有RGB灯光,且能够通过AURORA Sync Pro与主流板厂的主板实现ARGB灯效同步,烘托游戏氛围

      我们使用3Dmark Time Spy Extreme这一压力颇高的DX12 4K游戏负载对影驰星烽散热系统进行了测试。可以看到,在20轮高负载下,这张显卡的帧率稳定度达到了98.5%,影驰星烽散热系统的强悍可见一斑。

      显卡尾部的全金属背板搭配镂空设计能够进一步使得空气自由流通,提升显卡散热效能。

      在图形接口方面,影驰GeForce RTX 4070 Ti SUPER 大将OC仍然提供了三个DP1.4a与一个HDMI 2.1接口,足以满足大多数用户的使用需求。同时,完整的三槽挡板与充足的气流通道不仅确保了显卡能够稳固地固定在机箱上,还能够确保散热系统的效果。

配套软件

      作为一家著名板卡厂商,影驰的软件生态也同样充实,其显卡家族的主要核心应用是Xtreme Tuner这一超频工具,玩家可以使用它方便地对显卡的各项参数进行调整,并实时监控温度、频率等参数。

      同时,玩家还可以通过Xtreme Tuner软件对ARGB灯光进行调整适配,也同样十分方便。

!!!把我修改成标题!!!

规格与理论性能

      本次RTX 4070 Ti SUPER显卡的规格提升在整个RTX 40 SUPER家族中应该说是最为显著的,从原先的AD104核心直接更换成了原先给RTX 4080显卡提供的AD103核心。它所使用的AD103-275-A1核心拥有66组SM单元,共计8448组流处理器,对应的光线追踪加速器、Tensor Core集群与光流加速器数量也有上涨。相比RTX 4070 Ti 有着10%的整体规格涨幅。

      因为使用了更大的AD103核心,RTX 4070 Ti SUPER显卡的显存规模也有显著提升,1从原先的12GB 192bit GDDR6X显存升级到16GB 256bit GDDR6X显存,理论内存带宽提升了42%左右,即使是在对显存带宽极为敏感的4K高画质3A大作与各类AIGC/GPGPU生产力应用中也能够拥有可观的性能表现。

      在3DMark套件的理论性能测试中,我们手中这张影驰GeForce RTX 4070 Ti SUPER 大将OC与RTX 4070 Ti相比,跑分有着4.77%—8.88%的提升,而对比前一代RTX 3070 Ti则提升更为明显。

      接下来的两项光线追踪性能测试中,影驰GeForce RTX 4070 Ti SUPER 大将OC对比RTX 4070 Ti也都有着10%以上的分数提升。除此之外,随着本次加量不加价的RTX 40 SUPER系列GPU的上市,在DLSS 3加持下的高分高刷高预设高流畅的光追游戏体验也更加稳定,这一点在接下来的游戏测试中也能看到。

      同时,更大的规模并不代表它的功耗也同步爆棚。在高能耗比的底层设计、TSMC 4N NVIDIA定制工艺以及前文提到过影驰星烽散热系统的加持下,即使是大规模的AD103核心,在烤机中也仅有285W左右的功耗,温度也仅有60度出头,可以说是完美延续了RTX 40系能耗比超群的优良传统。

      同时,我们抓取了多个常见场景下的功耗数据进行进一步参考,使用U27G3X显示器在4K 160hz模式下运行。可以看到,在多个常见的使用场景下,这张显卡的能耗比表现都十分优秀,为玩家带来极致游戏体验的同时功耗也拿捏得十分到位。尤其是在开启DLSS 3技术的游戏场景下,功耗表现更是优秀得令人咋舌。

DLSS 3.5与光线追踪

      DLSS 3可以说是RTX 40系最大的独家黑科技,凭借着RTX 40系显卡中新加入的光流加速器与第四代Tensor Core,这项技术能够为玩家提供沉浸式的游戏体验与更流畅的游戏帧数。在极限情况下,玩家显示器上只有八分之一的像素是由图形渲染管线渲染,剩下的87.5%全部来自DLSS管线,但在视觉效果上依然高度可用,能够显著拉高游戏的帧数表现。

      在3Dmark中,我们也同样可以对DLSS 3下的理论性能进行测试。我们使用质量模式进行性能测试,下文的游戏测试中也一样如此,因此玩家们会发现在实际上手后还能压榨出比我们给出的数据更优秀的性能表现。在2K分辨率下,帧数表现从原生的71.66帧一跃飙升至138.239帧,表现直接翻倍;而在4K分辨率下,从33.39帧到85.6帧,帧数有着156%的提升幅度,一跃来到了流畅水平,表现十分强劲。

除了游戏帧数的进一步提升,随着DLSS 3.5技术的发布,另一项先进的图形技术也开始大展拳脚,这就是光线重建。通过使用AI工具对游戏渲染管线输出的帧进行统一降噪,并使用与DLSS 3相比扩充五倍的数据量训练的超级模型,DLSS 3.5技术加持下的游戏与工作站应用能够同时实现更真实的画面表现与更流畅的性能体验。

在赛博朋克2077中,我们开启光线重建后,玻璃对面小贩摊位上的抽油烟机周围的光照效果更符合我们在实际生活中能够看到的景象,这对于赛博朋克2077这款高度复杂的开放世界游戏来说毫无疑问能够显著提升游戏的代入感。

      而在性能层面,由于我们的画面预设-光线追踪:超速开启了全景光追,对显卡的压力极大,我们进一步看到了DLSS 3.5光线重建技术能够带来相当显著的性能提升。在2K分辨率、使用光线追踪超速、开启DLSS 3.5质量预设,影驰GeForce RTX 4070 Ti SUPER 大将OC以97帧的超高速帧数遥遥领先,对比原生渲染有着高达258%的恐怖提升,全高特效下流畅游玩赛博朋克2077不在话下。

      虽然全景光追大幅提升了游戏画质,但同时也拔高了显卡负载,在4K分辨率中,使用光线追踪超速,且开启DLSS 3.5质量预设后,游戏保持着38帧的平均帧数,相比未开启DLSS 3.5也得到了170%的超大提高。在DLSS 3.5的加持下,无论是在2K还是4K分辨率中,游戏帧数都得到了大幅提升,这将有助于玩家在这样一款第一人称动作射击游戏中获取极佳的体验。

      另外一款支持全景光线追踪的DLSS 3.5游戏就是前段时间刚刚发布的心灵杀手2。作为Remedy十年磨一剑的巨作,这款游戏继承了Remedy对于游戏叙事艺术以及先进图形技术的深度打磨,在图形技术栈方面颇为激进,使用了包括路径追踪在内的大量先进技术,在提供业界一流的画面表现的同时也对玩家的硬件提出了极高的要求。

      可以看到,在启用DLSS 3.5光线重建技术后,画面整体的观感更为清晰,且细节上更为突出,例如路边汽车上光照的方式符合车身和灯具的曲线,这样画面效果上的提升对于心灵杀手2这款心理恐怖游戏来说毫无疑问是百利而无一害的。

      而在性能方面,我们也看到了类似的表现。由于全景光追需要追踪场景里每一束光线的多次反射轨迹,且心灵杀手2的故事情节发生于一座现代美国城镇,存在更多更复杂的反射场景,这使得全景光追会进一步压榨显卡的性能,致使在不开启DLSS 3的前提下全景光追几乎无法游玩,即使RTX 4070 Ti SUPER显卡也只能在4K分辨率下跑出6帧不到的水平。然而,在开启光线重建后,无论仅支持DLSS 2技术的RTX 3070 Ti还是支持DLSS 3的RTX 4070 Ti SUPER性能提升的幅度也同样十分显著。毫无疑问,在可预见的未来内,全景光线追踪和光线重建技术将得到相当广泛的应用,让玩家们能够体验到画质更优、更具沉浸感的游戏。

      当然,目前市场上还有很多游戏并不支持全景光线追踪和光线重建技术,但这并不代表它们并不值得游玩,我们也挑选了几款游戏用于测试,看看它们的表现如何。例如,战锤40K:暗潮就是一款并不支持全景光线追踪和光线重建技术的四人合作游戏,但还是支持DLSS 3帧生成技术。

      在测试中,我们发现,RTX 3070 Ti显卡在开启DLSS 2质量档位后,其游戏性能与RTX 4070 Ti SUPER显卡原生渲染时的性能表现相当,而RTX 40系独占的DLSS 3帧生成技术能够实现远超DLSS 2的游戏体验。考虑到DLSS质量挡位的预设大约是67%的原生分辨率,这意味着RTX 4070 Ti SUPER在传统光栅+光追管线上的综合性能提升过半,搭配容量翻倍且速度更高的显存以及全套AI硬件栈,对于现在仍然使用RTX 3070 Ti显卡的玩家们来说,RTX 4070 Ti SUPER显卡毫无疑问是相当值得升级的选择。

      而在另外一款光追+DLSS 3游戏光明记忆无限中,我们也能够看到类似的趋势。这款由著名一人成军工作室飞燕群岛完成,尽管游戏时长仅有1-2小时,但却包含了大量FPS玩家们颇为熟悉的桥段,甚至还有一个起承转合相当完整的故事情节,可以说是独立游戏中的精品了。与此同时,这款游戏也同样拥有相当先进的图形技术栈,从光线追踪到DLSS 3均有导入,因此也十分适合用于测试显卡性能。

      在这款游戏中,我们发现与前面战锤40K:暗潮相近的趋势,即RTX 3070 Ti在DLSS 2质量档位下拥有与RTX 4070 Ti SUPER显卡原生渲染下相近的性能表现,而DLSS 3又能够在此基础上实现近乎翻倍的帧率提升,可以说表现是十分优秀了。

NVIDIA Reflex低延迟电竞体验

      与DLSS 3技术相伴而行的则是NVIDIA的另一核心游戏技术:NVIDIA Reflex。由于DLSS 3需要生成全新的游戏帧插入渲染管线,确保这些帧能够以一个符合逻辑的方式展现给玩家,就需要绑定NVIDIA Reflex一并行动,否则游戏的表现就可能会出现问题。

      从玩家在屏幕中看到对手,按下按键做出应对(无论是加速、传球还是射击、魔法),再到玩家在显示器中得到反馈,这全套流程即是NVIDIA所定义的系统延迟,这其中还能再细分为由控制器(如鼠标、键盘、手柄等设备)带来的外设延迟、PC系统的系统延迟以及显示器本身的显示延迟,而NVIDIA Reflex技术所极力优化的即是其中的PC系统延迟。

      NVIDIA Reflex能够提供针对CPU后台进程、GPU渲染管线以及频率等方面的全套优化,这也使得DLSS 3这样的帧生成功能能够以一个符合逻辑的方式呈现在玩家眼前。而与此同时,由于低延迟带来的极高竞技优势,目前市场上大部分热门的电竞游戏也都同样针对这一技术提供了支持。

      例如,在CS2中,玩家破天荒地在这款全球顶流电竞游戏中可以启动NVIDIA Reflex来降低延迟。与其他方案不同,通过集成,玩家可以确保在降低延迟时不会受到如VAC这样反作弊技术的威胁,对于一款拥有成熟电竞生态的游戏来说这一点相当重要。

      我们在2K分辨率下测试了CS2在开启与关闭NVIDIA Reflex技术中的游戏体验。可以看到,在开启NVIDIA Reflex之后,游戏的延迟近乎砍半,对于激烈对战中体验可以说是天翻地覆,玩家拥有更多机会能够轻松拿下对手。

NVIDIA AI生态与生产力应用

      自从2022年底首次发布,ChatGPT以及它所代表的GPT和AIGC生态可以说是彻底改变了人们的计算方式。而随着NVIDIA AI与TensorRT等技术栈的发布,诸多先进的生成式AI技术能够在用户的电脑上使用GeForce RTX家族的游戏显卡展开部署,并以比传统CUDA计算更高效的方式进行计算。

      例如,在Stable Diffusion中,我们可以使用TensorRT显著加速SDXL大模型图像生成。我们使用官方提供的TensorRT拓展包训练了基于TensorRT的SDXL加速引擎,并使用1024x1024尺寸、采样50步、CFG SCALE 7的配置生成10批单张图片进行性能测试。

      可以看到,与不启用TensorRT的耗时166.6秒的传统CUDA计算相比,启用TensorRT之后我们的大模型图片生成能力显著提升,时间来到了86.8秒,提升幅度接近50%。毫无疑问,考虑到我们给到的参数,这样的时间差十分震撼。同时,随着用户生成的图片数量/参数提升,相信使用TensorRT拓展包能够为用户节约更多的时间和算力资源。而当我们考虑到RTX 4070 Ti SUPER显卡拥有的16GB高带宽GDDR6X显存,这张显卡相当适合专业级别的AIGC内容创作者在丰富的NVIDIA AI生态中的各式应用中进行内容创作,使用TensorRT生态链扩展创意工作流。

      除了Stable Diffusion之外,还有很多应用也能够使用NVIDIA AI加速。例如,On1 Resize AI 2023就是一款有效使用了NVIDIA AI技术栈的图像无损放大工具。

      我们使用这一工具对几张图片进行了尺寸放大,可以看到,在AI技术加持下,画面的细节得到了良好的保留,且镜头的炫光、聚焦等效果也得到了良好的保留,整体画面观感也让人难以联想到传统印象中的“AI生成”,表现十分出色。

      而在速度方面,每张受测图片的生成时间都在十秒以内,最慢的也只有七秒半左右,表现可以说是难以匹敌了。

      而在不依赖AI算力的传统GPGPU应用中,影驰GeForce RTX 4070 Ti SUPER OC显卡也拥有颇为强劲的能力。例如,在3D建模与CGI软件Blender中,我们使用官方benchmark针对4.0.0版本下的三个版本进行了测试。在三个不同的Benchmark中都得到了相当可观的采样数表现,十分适合内容创作者。

      而在更传统的工业应用测试SPECviewperf 2020中,我们也得到了相当不错的性能表现,证明这颗GPU应对传统工业级工作站负载也同样能够轻松应对,十分出色。

总结

      回顾我们进行的全部测试,在3Dmark的测试中,影驰GeForce RTX 4070 Ti SUPER 大将OC对比上一代的RTX 3070 Ti着50%以上的纯光栅+光追性能提升,而在引入DLSS 3这一神器之后提升幅度更是进一步提升到接近翻倍。作为一张定位入门级4K的游戏显卡,即便是在赛博朋克2077、心灵杀手2这样的开启了路径光追的顶级画质3A游戏中,影驰GeForce RTX 4070 Ti SUPER 大将OC也能够在4K分辨率、画质拉满的情况下获得稳定的游戏体验,更不用说目前还不支持路径光追技术的的各类电竞游戏与3A大作了。同时,在如Stable Diffusion这样的生成式AI应用中,我们也能够在开启TensorRT时体验耗时砍半的显著提升,相信用户们也能够用这张显卡在如NVIDIA RTX Remix这样的AI加速创意应用中体验创作的乐趣。

      总而言之,这张全新的影驰GeForce RTX 4070 Ti SUPER OC显卡的性能表现相当可观,考虑到4K高分辨率显示器的普及、全景光追等新技术带来的对显存的更高要求,还有NVIDIA AI生态中各类AIGC创意工具链爆发式的增长,这张显卡搭载的16GB高速显存将同样为游戏的体验以及提升生产力水平带来更大的性能空间。所以无论是体验4K分辨率下的3A大作还是在想AI加速的生产力应用中尽情创作的玩家,这张影驰GeForce RTX 4070 Ti SUPER 大将OC都十分适合选购。并且影驰官方还支持三年个人送保,在售后方面也能保证每一位玩家长期用卡体验。

分享到:

APP精彩推荐

相关资讯
热门资讯
下载APP可查看更多精彩资讯