去年的 RTX 3060 Ti 由于其强悍的性能,一时间成为了主流游戏玩家们的好选择。因此今年发布的基于全新 Ada 架构打造的 RTX 4060 Ti 也同样引人注目。大家关心下一代 RTX 4060 Ti 能否延续 RTX 3060 Ti 的优秀表现、能否继续延续 60 Ti 系列的高性价比。
而 NVIDIA 方面交出的答卷是 NVIDIA GeForce RTX 4060 Ti 8G 和 NVIDIA GeForce RTX 4060 Ti 16G 这两张新卡。它们的性能几乎相同,也都拥有 32MB 的 L2 大缓存,带来更高的读取命中率。两者的区别在于 16G 大显存版更适合加速 AI 内容创作,8G 版则拥有更高的性价比适合 1080P 高帧游戏。它们相比于 RTX 3060Ti GDDR6 都拥有 15%-70% 的性能提升,相比于 2060 SUPER 更是有着 60%-160% 的性能提升。能带来 1080P 分辨率下的高帧率低延迟游戏体验。
IT之家也是提前收到了公版的 NVIDIA GeForce RTX 4060 Ti 8G,在本次测试中,我们将使用一套高配 intel 配置来测试,分辨率也都调整到 1080P,以避免显卡瓶颈。具体配置如下:
(资料图片)
外观设计
NVIDIA GeForce RTX 4060 Ti 8G 的外观设计与我们之前测试的 NVIDIA GeForce RTX 4070 非常相似,显卡本体都为标准的 2 槽设计,长度也只有 24cm 左右,整体设计方正紧凑。即便是 A4 结构的 ITX 机箱也可以轻松装下。
整个散热器和 NVIDIA GeForce RTX 4070 唯一的区别在于,旁边的金属包边从枪灰色变成了银灰色,观感更灵动一些。
正面则是厚实的散热鳍片,整张显卡全金属的设计也有利于散热。
显卡风扇采用一左一右一上一下的独特排布方式,能形成垂直风道,更好地带走鳍片上的热量。
显卡外围环绕着一层银灰色的全金属包边,上方印有醒目的 GeForce RTX 标识。
螺丝接口被设计在了右侧,整卡的一体感很强。
供电方面,它采用最新的 ATX3.0 规范的 16Pin 供电接口,随包装内附赠了 1*8Pin 转 16Pin 的转接头,这个设计还是比较幽默的,可以看出 NVIDIA 推广 ATX3.0 标准的决心。
事实上,它的 TGP 功耗仅 160W 左右,单 8Pin 的供电完全能带动。因此绝大多数非公版 RTX 4060 Ti 都选择单 8Pin 的供电设计。
I / O 接口挡板采用 RTX 4070 同款的深灰配色,接口方面配备了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 输出。
核心解析
RTX 4060 Ti 基于 AD106 核心打造。整体架构和我们之前测试的 RTX 4070 是差不多的,不过里面的 GPC 从 4 组变成了 3 组,内部共有 4352 个 CUDA 核心、136 个 Tensor 核心、34 个第三代 RT 核心和 51 个 ROP 单元,基本上可以理解为保留了 RTX 4070 75% 的核心规模。招牌的 NVENC 视频编码单元和 NVDNC 视频解码单元也依旧存在,这意味着它也是很适合用来进行内容创作的。
RTX 4060 Ti 的 BOOST 频率是 2535MHz,默认频率为 2250MHz。显存方面是 128-bit 位宽的 8GB GDDR6 海力士显存,功耗和发热都极大的降低了。
至于为什么会选择 128-bit 的闪存,NVIDIA 官方也做出了解释,主要原因在于,全新 NVIDIA Ada Lovelace 架构的存储子系统将 L2 缓存的大小增加了 16 倍,极大提高了缓存命中率。英伟达称,从历史上看,显存位宽一直被用作确定新 GPU 的速度和性能等级的重要指标。然而,显存位宽本身并不能充分表明存储子系统的性能。相反,更全面地了解存储子系统设计及其对游戏性能的整体影响是有帮助的。
如上图所示,Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。
以上这些显存利用效率的提高,都要得益于最新的 NVIDIA Ada 架构,NVIDIA Ada 架构是 NVIDIA 的最新架构,它基于 TSMC 4N NVIDIA 定制工艺打造,从而实现了高达 2 倍的性能功耗比飞跃。它的流式多处理器吞吐量超过上一代产品的 2 倍,第三代 RT Cores 的光线追踪计算能力更是提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。而 SER 技术为光线追踪带来了最高可达 3 倍的性能提升,整体游戏性能也可高达 25% 的提升。
新的 Ada 架构为各种专业图形、视频、AI 和计算工作负载提供了惊人的性能和能效,也带来了许多创新的特性,例如:
1.新增了光流加速器,能够利用 AI 预测场景中的运动变化,实现了 DLSS 3 的帧生成技术,大幅提升了帧率和图像质量。
2.支持了 AV1 编码器,能够有效压缩视频文件的大小,同时保证更高的画质。这对于视频转码、流媒体、视频会议、增强现实和虚拟现实等应用场景非常有用。
3.引入了 RTX VSR 功能,能够实现实时视频超分辨率,让低分辨率的视频在高分辨率的屏幕上也能呈现出清晰的细节。
值得一提的是,本次 RTX 4060 Ti 8G 采用的接口也发生了变化,从 PCIe 4.0*16,变成了 PCIe 4.0*8,这对于采用新主板的玩家们是不会带来任何影响的。但如果你的主板只支持 PCIe 3.0 的话,那么实际使用中就是以 PCIe3.0*8 运行的,带宽会受到一定影响,建议搭配比较新的平台来装机。
理论性能
我们在导语就有说到,NVIDIA GeForce RTX 4060 Ti 8G 的功耗非常低。具体能有多低呢?我们接下来就进行烤机测试。烤机 15 分钟后,核心温度稳定在 66.8℃左右,显存温度约 78.2℃。整卡功耗仅仅 160W,不仅远低于 RTX 3060 Ti,甚至比 RTX 3060 还更低。如果电源不虚标,CPU 配个 i5、R5 之类的百瓦 CPU,只要 450W 的电源都能带动整机了,不得不说 Ada 架构和 TSMC 4N 定制工艺的能效比真的非常高,RTX 4060 系列也将会是 ITX 玩家们的福音。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测 NVIDIA GeForce RTX 4060 Ti 8G 的得分为 99.5%,性能释放极其稳定。
在 3DMark TimeSpy DX12 测试中,显卡分数达到了 13653 分,作为对比,RTX 3060Ti 的成绩为 12277 分,提升大约在 10% 左右,而功耗却低了非常多。
在 3DMark FireStrike Extreme DX11 测试中,NVIDIAGeForce RTX 4060 Ti 8G 显卡分数达到了 16194 分,作为对比,RTX 3060 Ti 的分数为 14553,提升幅度也是在 10% 左右。
而在 3DMark Portal Royal 光追测试中,NVIDIAGeForce RTX 4060 Ti 8G 获得了 8056 分,作为对比,RTX 3060 Ti 的分数为 7158 分,看来 RTX 4060 Ti 8G 的理论性能相比于 RTX 3060 Ti 就是在 10% 左右了。
游戏实测
接下来,我们就进行一下游戏实测,分辨率调整为 1920*1080,画质统一调整为最高,有光追则打开最高档的光追,有 DLSS 就开启到质量档。首先是竞技游戏《CS:GO》,这款游戏可以展现 RTX 4060 Ti 8G 在高帧下的表现。运行自带的 BenchMark 后,平均帧达到了 537 帧,可以满足高帧畅玩的需求,完全能跑满各种电竞屏了。
值得一提的是,目前已有 70 款游戏已支持 NVIDIA Reflex 低延迟技术,其中有 8 款主流竞技射击游戏支持 NVIDIA Reflex,包括:《Apex 英雄》,《使命召唤: 战区 2》,《命运 2》,《逃离塔科夫》,《堡垒之夜》,《守望先锋》”归来”,《彩虹六号:围攻》和《无畏契约》。笔者期待 CS2 能够在更新起源 2 版本后,也能加入 NVIDIA Reflex 的支持,让所有热门的 FPS 游戏都能享受低延迟的优势。
接下来笔者还测试了两款经典 3A 大作。《荒野大镖客 2: 救赎》在开启质量 DLSS 的情况下,能达到平均 115 帧,已经能满足百帧畅玩高画质了,这个 1080P 下的体验无疑是非常出色的。
在另一款经典的 3A 大作《古墓丽影: 暗影》中,我们也得到了类似的答案。在 1080P 最高画质下运行自带的 BenchMark,已经能达到平均 212 帧,如此高的帧数意味着征服 2K 分辨率也不在话下了。
在光追大作《控制》中,开启最高光追的情况下甚至能达到 144 帧,以电竞帧数畅玩光追 3A 大作再也不是梦了。
真正让 RTX 4060 Ti 和 RTX 3060Ti 拉开差距的,是其 DLSS 3 技术,它能够利用 AI 和 GeForce RTX 40 系列 GPU 上的第四代 Tensor Core 和光流加速器,生成更多的高质量帧,从而大幅提升帧数。DLSS 3 是 NVIDIA 深度学习超采样技术的最新版本,也是神经图形技术的革命性突破,能够在保持画质和反应速度的同时,将性能提升高达 4 倍。
简单来说,过去的 DLSS 2 技术是通过渲染一个低分辨率图像,然后通过 AI 放大至高分辨率,从而提升画质和帧率。而全新的 DLSS 3 技术在兼容 DLSS 2 的基础上,新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出的全新帧,从而实现帧率的倍增。同时,结合 DLSS 2 的超分辨率功能,AI 能够重建多达八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
目前已经有超过 300 款 DLSS 游戏和应用发布。其中已有超 30 款已发布的 DLSS 3 游戏。从发布进度来看,在 DLSS 2 和 DLSS 3 各自发布的前六个月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍。看来适配难度是相当低的,相信将来有越来越多的游戏适配 DLSS 技术。
我们先来看看压力最大的《赛博朋克 2077》在光追 + 1080P 分辨率下的帧数情况,在默认状态下,RTX 4060 Ti 8G 还是没有办法畅玩的,平均帧数约 45 帧。如果开启 DLSS 2 质量,帧数就可以达到平均 79 帧畅玩了。而如果开启 RTX 40 系列专享的黑科技 DLSS 3,瞬间暴涨到了平均 119 帧,百帧畅玩光追不在话下。
传奇 3A 大作《巫师 3:狂猎》最近也更新了次世代版,配置要求大大提高,当然画质也跟上了潮流,放在如今也毫不落伍。同时它也提供了 DLSS 3 技术的支持,这对于 RTX 40 系列显卡无疑是一个好消息。
《巫师 3:狂猎》次世代版在 1080P 分辨率不开启 DLSS 的情况下,GeForce RTX 4060 Ti 8G 平均仅有 43 帧,如果开启质量档 DLSS 2,就可以达到平均 65 帧流畅游玩。如果开启 AI 加持的 DLSS 3 技术,帧数就能暴涨到平均 102 帧,大部分场景可以实现 1080P 最高特效百帧畅玩了。
在另一款画质爆炸的次世代 3A 大作《瘟疫传说:安魂曲》中,优化相对来说就要好不少了。即便不开启任何 AI 技术,也可以满足 1080P 60 帧流畅游玩,而在 DLSS 3 加持后更是可以以电竞帧数畅玩。
实测 RTX 4060 Ti 8G 在不开启 DLSS 技术时就已经能满足 60 帧畅玩了。如果开启 DLSS 2 质量档,就能达到平均 84 帧,如果开启 DLSS 3 插帧后,帧数更是会暴涨到平均 110 帧,满足高刷显示器的需求。
那么,60 Ti 系列在”代与代之间”的 GPU 会有多大的提升呢?笔者这套配置换上 RTX 3060 Ti GDDR6 (OC) 测试了一套数据,看看隔代之间性能会有多少提升,在 DLSS 3 技术的加持下又会有多少提升。实测不开启 DLSS 3 的情况下,RTX 4060 Ti 8G 大约有 15% 的帧数优势。如果开启 RTX 40 系列独占的 DLSS 3 技术,帧数则普遍相比上代实现了近乎翻倍的提升,效果真是相当出彩。
前面我们有提到过,RTX 4060 Ti 8G 的功耗是相当低的,实际上一根 8Pin 供电就能带动。因此我们还使用英伟达官方的 FrameView 工具统计了一下各个 3A 大作中的平均功耗。测出来的数据令笔者十分惊讶,大部分 3A 大作中实际功耗都在 130-140W 左右,甚至比很多笔记本分配给 GPU 的功耗都低了。如此 DIY 玩家们完全不需要买大电源了,ITX 玩家们也可以期待大批单风扇 RTX 4060 Ti 上市。
创意生产
NVIDIA GeForce RTX 4060 Ti 系列也被赋予了一定的创意生产能力,该显卡支持安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用。专有的 SDK 能使这些应用的运行速度更快,并提供独家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。如果选购 16G 大显存版本的话,也让它具备了一定的生成式人工智能的运算能力,拿来进行简单的 AI 绘画训练也是没有问题的。不过 16G 大显存版尚未发售,我们接下来还是用 8G 版做一下简单的测试。
NVIDIA GeForce RTX 4060 Ti 8G 的 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。
我们也实测了一下 V-Ray Benchmark 的性能表现,GeForce RTX 4060 Ti 8G 获得了 1360 分,可以应对一些中等规模的建模渲染需求。
得益于光追性能的提升,GeForce RTX 4060 Ti 8G 在 V-Ray GPU RTX 中的分数也提高到了 1919 分,也能应付一些中等负载的光追建模渲染需求。
我们还测试了一下 GeForce RTX 4060 Ti 8G 在 Blender 中的性能,实测结果如下,能看出 GeForce RTX 4060 Ti 8G 对于这种建模工作有非常好的加速效果。
在视频后期这一块,GeForce RTX 4060 Ti 8G 同样配备了 NVENC 编码器。并且 RTX 4060 Ti 8G 也支持下一代视频编码技术 AV1,AV1 能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。随着各大视频平台希望节约服务器流量费用,AV1 编码必将成为未来的主流编码方式。
我们做了一个小实验。在剪映专业版中,导出一个相同分辨率相同码率的视频,一个编码协议选择传统的 H264, 一个选择下一代的 AV1 编码,结果 H264 编码的体积为 140M,AV1 编码的体积仅 106M,在保证画质的前提下体积小了非常多。
并且笔者还发现,支持 AV1 编解码的 GeForce RTX 4060 Ti 8G 导出这个视频可以通过显卡加速,仅需 8 秒即可完成压制。
而 GeForce RTX 3060 Ti 就不支持 AV1 编码硬解了,只能用 CPU 软解,导出时间长达 1 分 26 秒,花费时间长了几十倍。可以说,RTX 40 系列 GPU 是视频工作者们“战未来”的利器。
IT之家还为大家测试了 PugetBench For Adobe 全家桶,看看它能否胜任视频剪辑工作。实测 GeForce RTX 4060 Ti 8G 在创意工作者们常用的 Adobe Premiere 中,我们开启 GPU Cuda 加速,然后使用 PugetBenchmark 进行测试。最终得分为 1188 分,浏览时间线上的 4K 视频毫无压力。
另外一款压力更大的视频特效软件 Adobe Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1504 分,能用来制作一些比较复杂的视效。
除了视频内容生产以外,在视频内容消费领域 RTX 4060 Ti 8G 也提供了 RTX VSR 技术。全称为 RTX Video Super Resolution(RTX 视频超分辨率技术)。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,目前这一技术已经适配了 Chrome 浏览器和 Edge 浏览器,以及本地播放器 VLC。
RTX 视频超分辨率的使用非常简单,只要将 RTX 30 系列 / 40 系列的驱动程序更新到最新版本,并将 Chrome / Edge 浏览器也更新到最新版本便可以启用。启用路径为:NVIDIA 控制面板 —— 视频 —— 调整视频图像设置。此选项框下有四个档位可选。档位越高超分辨率效果更明显,但也会消耗更多的 GPU 资源。
目前它已支持国内的主流视频平台(哔哩哔哩、斗鱼和虎牙),以及一些国外的视频平台(Youtube、Twitch、Netflix、Hulu 和 Disney+)。同时它也支持本地视频超分辨率。在下面的测试中,从最左边的原生 480P 分辨率超分后,后面的 1-4 档能看出更加清晰了,实际观感媲美 4K。
↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4
总结
在纯理论性能上,NVIDIA GeForce RTX 4060 Ti 8G 相比于上一代的提升大概在 10% 左右。当然了,AI 时代正汹涌而来,在 DLSS 3 技术的帮助下,3A 大作的帧数可轻松实现翻倍的提升。虽然现在 DLSS 3 覆盖的游戏只有数十款,但从 DLSS 2 适配的速度来看,我们离 DLSS 3 普及也不是很远了。在我们的实际体验中,RTX 4060 Ti 8G 能满足 1080P 最高画质下百帧畅玩 3A 大作,电竞游戏更是能以极高画质超低延迟运行,适合整机预算在 5000-7000 左右的玩家们装机,也适合还在用 RTX 20 系及之前的老卡的玩家们升级。
价格方面,NVIDIA GeForce RTX 4060 Ti 8G FE 版的价格定在了 3199 元,预计非公版第三方的价格能来到 3000 以下,这对于新装机的玩家们来说,会是一个不错的选择。如果想拿来做生产力的话,不放期待一下后续发售的 16G 大显存版 NVIDIA GeForce RTX 4060 Ti。
关键词: