在经历了改名风波后,GeForce RTX 4070 Ti 系列终于与我们见面了,每当有这种新卡发售,笔者总是会下意识地去关注一下耕升推出的非公版,因为它们总能在保证性能释放的基础上,击穿价格的底线。
IT之家也是提前收到了耕升的 GeForce RTX 4070 Ti 追风 EX,看看它的表现究竟如何,能否成为高端玩家的性价比之选。在本次测试中,我们尝试使用一套高端 AMD 配置来测试,具体配置如下:
【资料图】
外观设计
耕升 GeForce RTX 4070 Ti 追风 EX 是一张标准的 3 槽的大型显卡,整体设计紧凑,三围仅 327*137*62mm,可以塞进大部分 MATX 机箱。
GeForce RTX 4070 Ti 追风 EX 采用三风扇设计,每个风扇有 9 片白色扇叶组成,中间用追风系列的 Logo 点缀,四周的包边如同嶙峋的黑曜石。
GeForce RTX 4070 Ti 追风 EX 的背板为金属材质,采用穿透式设计,挖出了大面积的镂空,方便散热器直接吹透。
显卡背板最外圈是一层塑料的黑色包边,上方印有 Geforce RTX 的标识,右侧的耕升 LOGO 提供了 RGB 灯光功能,可以使用“神同步灯光”功能实现灯效同步,也可以在控制软件中自定义颜色和亮度。
供电方面,它采用最新的 ATX3.0 规范的 16Pin 供电接口,随包装内附赠了 2*8Pin 转 16Pin 的转接头,这意味着 GeForce RTX 4070 Ti 追风 EX 的功耗是非常低的,电源兼容性也非常好,常规电源的双 8Pin 输出即可带动。
I / O 接口挡板采用银灰配色,接口方面配备了 3*DP1.4 接口和 1*HDMI2.1 接口,最高支持 8K 60 帧输出。
核心解析
耕升 GeForce RTX 4070 Ti 追风 EX 的核心与 RTX 4080 的 AD103 不同,它基于 AD104核心打造的,里面有 5 组满血的 GPC,内部共有7680个 CUDA 核心、240个 Tensor 核心、60 个第三代 RT 核心和 80 个 ROP 单元,起名叫 RTX 4070 Ti 确实是比较恰当的。
RTX 4070 Ti 的默认频率是 2610MHz,而耕升 GeForce RTX 4070 Ti 追风 EX核心频率是 2655MHz,看来是进行了一些出厂预超频。显存方面则是 192-bit位宽的 12GB GDDR6X。从上述定位中我们可以看出,RTX 4070 Ti 是比较适合 4K 游戏的高端显卡。
耕升 GeForce RTX 4070 Ti 追风 EX 同样采用了最新款的 NVIDIA Ada 架构,它基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器的吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
反映到具象的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。
理论性能
接下来我们进行理论性能测试环节。首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在67.9℃左右,功耗稳定在285W 左右,与其它的非公都是一样的。这个功耗可以说是相当低,一般 600W 以上的电源就更稳了,官方推荐 750W 以上。最关键的是,它仅需 2 个 8Pin 输出就可以正常使用,这意味着有升级想法的玩家们,完全不需要换电源。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测耕升 GeForce RTX 4070 Ti 追风 EX的得分为 99.2%,完美通过测试。
在 3DMark TimeSpy DX12 测试中,显卡分数达到了21407分,作为对比,公版 RTX 4080 的分数为 26552 分,GeForce RTX 3080 10G 版的分数为 17306 分,RTX 3090 的分数为 18981 分,RTX 3090Ti 为 21439分。可以看出耕升 GeForce RTX 4070 Ti 追风 EX 的 DX12 分数与 RTX 3090Ti 咬得非常紧,可以说 RTX 4070 Ti 的物理性能约等于 RTX 30 系列最旗舰的卡,功耗还低了不少,这一带能效比提升确实明显。
在 3DMark Fire Strike Extreme DX11 测试中,耕升 GeForce RTX 4070 Ti 追风 EX显卡分数达到了26195分,作为对比,GeForce RTX 3090Ti 为26111分,RTX 4070 Ti 同样与 RTX 3090Ti 表现出了更强劲的 DX11 性能。
而在 3DMark Portal Royal 光追测试中,耕升 GeForce RTX 4070 Ti 追风 EX获得了13697分,就没有 RTX 3090Ti 的 14819 分强了,可能是 12G 显存大小和 192bit 显存位宽的劣势带来的光追性能的差距。
IT之家制作了一份 GPU 理论分数的对比表,在大部分项目中,耕升 GeForce RTX 4070 Ti 追风 EX 相比于上代旗舰卡 RTX 3090 Ti 都非常接近,但功耗却少了一半,可以说 RTX 4070 Ti 是一张很适合 4K 游戏玩家的卡,也是一张升级成本很低的卡。
游戏实测
接下来,我们就进行一下游戏实测,看看 RTX 4070 Ti 能否通吃 4K 下的 3A 大作。以下项目我们均在 4K 分辨率最高特效下进行测试,首先是电竞游戏,我们选取了《CS:GO》和《守望先锋》:归来两款主流的 FPS 游戏进行测试。在 CSGO 中运行自带的 BenchMark,平均帧达到了 207.7 帧,可以满足 4K 高帧畅玩的需求,显卡完全不会成为瓶颈。
《守望先锋》:归来实测在 4K 最高画质下能跑到 289-299 帧左右,完美适配 300Hz 高端电竞显示器。
此外,在《守望先锋》中还提供了 Nvidia Reflex 技术的支持,可以减少外设的操作延迟和显卡的渲染延迟,进一步提升射击手感。从我们的测试数据中可以看出,开启 Nvidia Reflex 后整体延迟降低了近 10ms,这对于高端玩家们来说已经是可以感知的了。
接下来我们测试几款经典 3A 大作,在《古墓丽影:暗影》中,即便不开启 DLSS,也能在 4K 分辨率最高画质下跑到平均 105 帧,轻松实现流畅游玩。
在开启性能档 DLSS 后,帧率更是暴涨到了平均 171 帧,能满足 4K165Hz 显示器畅玩 3A 的需求。
而在《荒野大镖客 2:救赎》中,也可以在 4K 最高画质下运行在平均 75 帧,流畅游玩也不成问题。
在开启 DLSS 性能档后,帧数进一步提升到了 105 帧,游戏体验非常顺畅。
而在 4K 光追游戏中,压力就比较大了。比如光追 3A 大作《控制》。
不开 DLSS 的话,只有平均 30 帧,没法流畅游玩。但如果我们开启性能档 DLSS,帧数直接了将近翻 3 倍,达到了平均 87 帧,完全可以流畅游玩了。
即便是上述这些只支持 DLSS 2 的老游戏,都有如此惊艳的帧数提升,更别提它还可以通过最新的 DLSS 3 技术实现帧数的进一步暴增。DLSS 3 是一款由 AI 驱动的性能倍增技术,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
我们先来看看压力最大的《赛博朋克 2077》,在 4K 最高画质超级光追下运行它自带的 BenchMark,得到了以下数据。默认状态下只有 22 帧,完全无法流畅游玩,但在 DLSS 3 选项全开的情况下,至多可以实现帧数 4 倍的提升。相比于同档位的 DLSS 2,帧数提升了 26 帧,这些帧数都是用 AI 技术“补”出来的。而在实际游戏中,开到 DLSS 3 质量档就已经可以相当流畅的游玩了。
《巫师 3》最近也更新了次世代版,但配置要求也是真的高,幸好它提供了 DLSS 3 技术的支持,这对于 RTX 40 系列显卡无疑是一个好消息。
在不开 DLSS 时,即便是我们这么高的配置,依旧只有平均 24 帧。而在开启 DLSS 2 性能档后,帧数瞬间暴涨到了 52 帧左右。想要真正 4K 流畅游玩的话还是需要 DLSS 3 技术的帮忙,在 DLSS 3 平衡档下就可以满足全程 65 帧以上流畅游玩了。DLSS 3 性能下帧数最高可以实现近 3 倍以上的提升。
一进入《瘟疫传说:安魂曲》,我们就能感觉到它的细节特别出彩,当然对配置的要求也是非常高的。默认状态下难以 4K 流畅游玩,但是在 DLSS 3 加持后依旧可以额实现帧数翻倍轻松畅玩。
在不开启 DLSS 的情况下,RTX 4070 Ti 的帧数仅平均 38 帧,但在开启 DLSS 3 性能后,帧数几乎翻了 3 倍,达到了平均 114 帧,满足了 4K 畅玩次世代 3A 大作的需求。
最后我们还测试了一款国产的横版光追游戏《生死轮回》,《生死轮回》虽然是横版游戏,但在 RTX 光线追踪技术的加持下画质相当爆炸,当然配置要求也是相当之高。
默认状态下同样只有平均 27 帧不到,但在开启 DLSS 3 后,同样可以带来 2.5 倍的帧数提升,实现 4K 最高画质下 85 帧畅玩。
那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是 AI 生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。我们以《瘟疫传说:安魂曲》为例,开启 DLSS 3 后延迟反而比什么都不开还要低足足一半,这个技术的效果是立竿见影的。
创意生产
那么耕升 GeForce RTX 4070 Ti 追风 EX 能不能用于创意生产工作呢?答案当然是可以的。7680 个强大的 CUDA 核心在应对创意生产和深度学习方面会有一定建树。同时它也可以安装NVIDIA Studio 驱动,有超过 75 款创意应用都可以调用NVIDIA CUDA 核心的AI 算力,来大大提高工作效率。
在建模渲染类软件中,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
接下来我们进行一下V-Ray Benchmark,实测 GeForce RTX 4070 Ti 追风 EX 获得了 2292 分,可以顺利应对大部分的建模渲染需求。
得益于光追性能的提升,GeForce RTX 4070 Ti 追风 EX在 V-Ray GPU RTX 中的分数也提高到了3079分,也能应付一些试试光追的开发需求。
在主流的建模软件 Blender 中,GeForce RTX 4070 Ti 追风 EX 也能有不错的表现,具体分数如下。这个成绩拿来做大部分复杂建模也不在话下了。
IT之家还为大家测试了另一款常用的渲染器 Octane 自带的 BenchMark,可以看到它的渲染能力也是非常强的,在各项项目中,它的渲染能力都约等于 4 到 10 张 GTX 980 的算力,不得不说这个进步是相当显著的。
在视频后期这一块,耕升 GeForce RTX 4070 Ti 追风 EX 同样配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
为了检验它的视频渲染性能,IT之家还为大家测试了 PugetBench For Davinci以及 Adobe 全家桶。实测 GeForce RTX 4070 Ti 追风 EX 在 Davinci 中最终分数可以达2320分,流畅应对 4K 剪辑调色不在话下。
在创意工作者们常用的 Adobe Premiere 中,我们开启 GPU Cuda 加速,然后使用 PugetBenchmark 进行测试。最终得分为 1147 分。
另外一款压力更大的视频特效软件 Adobe Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1415 分,可见创意生产性能非常出色,能用来制作复杂的视频特效。
总结
从我们今天对耕升 GeForce RTX 4070 Ti 追风 EX 的测试来看,虽然它主打性价比,但它的性能释放也与其它更贵的 RTX 4070Ti 非公卡无异。得益于先进的 4nm 制程,GeForce RTX 4070 Ti 的功耗是相当低的,目前已经发布的所有 RTX 4070Ti 非公卡都可以轻松压住,所以如果你买显卡追求的是更高的性价比,那么击穿低价的耕升 GeForce RTX 4070 Ti 追风 EX 绝对是很好的选择。
目前耕升 GeForce RTX 4070 Ti 追风 EX 也已经上市,感兴趣的话可以去各大电商平台了解一下。