DLSS 3 与 AI 让使用体验成倍提升：英伟达 GeForce RTX 40

时间：2023-04-16

　　不知不觉，英伟达的 RTX 40 系显卡已经推出超过半年的时间，在这半年内，英伟达凭借像 GeForce RTX 4090 这样的旗舰显卡牢牢占据了高端显卡市场，可以说几乎无敌手，同时更是凭借 DLSS 3 等新一代特效让显卡面对光线追踪也丝毫不怵。不过之前发布的显卡都是面向高端以及旗舰消费群体，而对于偏向主流的消费群体，他们的预算似乎不能满足 GeForce RTX 4090 这样的显卡，因此像 RTX 4070 这样的主流偏上的显卡便是为他们所打造，实现 2K 光追游戏超过 100 帧速率游玩的愿望。

　　这半年以来，除了像游戏场景之外，AIGC 的火爆程度远超人们的想象，而利用 GPU 强大的算力实现 AIGC 成为了新用途，自然基于最新架构的 RTX 4070 显卡在 AI 创作上也更加出色，比如说 AI 创作性能能够比 RTX 3070 Ti 提升大约 40% 的幅度，将会成为创作者手中的一张神卡。那么这块显卡的实际表现究竟如何呢？我们一起来看下。

　　架构说明

　　对于 RTX 40 系显卡来说，想要满足包括 AI 创作以及 DLSS 3 等特效的实现，就不得不说 Ada Lovelace 架构，而这也是 RTX 40 系显卡的核心所在。相比较目前的安培架构 Ada Lovelace 架构在性能上有着巨大的飞跃，比如说流式多处理器的着色能力高达 83TFLOPS，吞吐量是上代的 2 倍，第三代 RT Cores 的有效光线追踪计算能力最高可以达到 191TFLOPS，是上代的 2.8 倍，第四代 Tensor Cores 则新增了 FP8 张量引擎，张量计算达到了 1.32PTLOPs，和上一代相比更是提升了整整五倍。也正是因为有了如此强大的算力，无论是游戏玩家还是创作者都可以借助 RTX 40 系显卡实现更加高效的创作效率。

　　硬件光流加速器

　　今年 RTX 40 系显卡最大的特点就是采用了全新的 DLSS 3 技术，能够有效地提升游戏在开启光追等重压环境下的帧率表现。

　　硬件光流加速器的原理就是提取其中的图像光流信息，同时参考游戏引擎中的运动矢量信息借助 AI 生成新的中间帧，借助插帧以及超分辨率，让 RTX 40 系显卡只要传统 1/8 的渲染量即可实现几乎相同的画面输出。目前 DLSS 3 仅为 RTX 40 系显卡所独享，同时也是 RTX 40 系显卡的一项杀手锏。

　　在显卡规格上，NVIDIA GeForce RTX 4070 显卡搭载的是 AD104-250 核心，拥有 5888 颗流处理器，36MB 的 L2 高速缓存容量，184 个 TMUS，64 个 ROPS 以及 46 个光追单元，除此之外 NVIDIA GeForce RTX 4070 显卡的基准频率为 1920MHz，Boost 频率为 2475MHz，而 FP32 单精度算力为 29TFLOPS。

　　显存上采用的是 GDDR6X 显存，显存容量为 12GB，192bit 的显存位宽，显存速率为 21Gbps，总共拥有 504GB/s 显存位宽，另外官方给这款显卡的 TDP 为 200W，当然实际测试的功耗有高有低。

　　外观

　　我们这一次拿到的是英伟达 NVIDIA GeForce RTX 4070 Founders Edition 也就是大家所称的公版显卡。

　　毫无疑问在见惯了 NVIDIA GeForce RTX 4090 Founders Edition 这样的庞然大物之后，NVIDIA GeForce RTX 4070 Founders Edition 显然小巧了很多，而且卡槽也变成了传统的双槽显卡，这对于使用 ITX 机箱的消费者来说显然是一个天大的好消息。

　　除此之外，NVIDIA GeForce RTX 4070 Founders Edition 也和上一代的 RTX 3070 公版显卡相差不大，在供电上继续采用 12+4Pin 的接口，当然相比较之前的 80 和 90，官方给的转接线为双 8Pin 转 12+4Pin，而 RTX 4080、RTX 4090 等显卡则是三 8Pin 转 12+4Pin。

　　而显卡的扩展接口基本上算是标准接口，包括一个 HDMI 2.1 以及 3 个 DP 1.4 接口，基本能够满足发烧友的使用。应该来说相比较 RTX 4080 以及 RTX 4090，NVIDIA GeForce RTX 4070 Founders Edition 的外观还是跟 RTX 30 系公版显卡差不多，没有那种太过于惊艳的感觉，算是中规中矩吧。

　　测试平台

　　测试平台跟以前也大差不差，我们选择 Intel Core i9-1900K 处理器作为这一次测试的 CPU，此外主板采用了 ROG 的 Z790 Hero 主板，内存则是科赋 DDR5 6200 内存，总容量达到了 32GB，除此之外，我们也选用了 WD_BLACK SN850X PCIe 4.0 SSD，事实上这套系统应对 RTX 4090 也是绰绰有余，更不用说 RTX 4070 显卡。本次测试基于微软 Windows 11 22H2 系统，采用的是 Game Ready 531.42 测试版驱动，未来显卡的性能将会随着驱动的完善而有所提升。

　　性能测试

　　理论性能

　　首先自然是理论测试，而理论测试的首选软件当然是最为著名的 3DMark，包括借助 FireStrike、TimeSpy 以及 Royal Port 分别测试显卡在 DX11、DX12 以及光追性能，而与 NVIDIA GeForce RTX 4070 Founders Edition 做对比的则是 NVIDIA GeForce RTX 3070 Ti 显卡。

　　通过 3DMark 的测试可以看到，在传统的光珊化测试中，NVIDIA GeForce RTX 4070 Founders Edition 显卡的理论性能比 NVIDIA GeForce RTX 3070 Ti 高出 15% 左右，似乎不是很高，事实上从 FP32 便可以看出，NVIDIA GeForce RTX 4070 Founders Edition 的光栅化成绩提升不是很明显。而光追测试中，NVIDIA GeForce RTX 4070 Founders Edition 显卡的领先幅度可以达到 25%。

　　实际游戏测试

　　DLSS 3 测试

　　当然如今的光追特效越来越拟真，对于显卡要求也越来越高，对此像英伟达这样的厂商便推出了 DLSS 等特效，借助 AI 来协助显卡在游戏中取得更高的性能表现。当然经过不断的迭代发展，目前的 DLSS 已经相当地成熟，并且几乎所有主流的游戏都会支持 DLSS 特效，同时 RTX 4070 显卡借助 Ada 架构还可以支持 DLSS 3。那么 RTX 4070 显卡借助 DLSS，能够在游戏中取得多少的性能表现呢？

　　在基于 DLSS 的测试中，由于除了 FP32 单精度性能之外，更加重要的便是 Tensor Core 的性能，自然在游戏表现中能够取得更加出色的成绩。而我们也可以看到支持 DLSS 3 的 RTX 4070 在游戏表现中显然要比 RTX 3070 Ti 更加出色，部分游戏的领先幅度也更大。

　　光栅化游戏测试

　　除了光追游戏之外，传统的光栅化游戏仍然占据主流，当然相比较光追游戏，光栅化游戏的性能基本上就是考察 FP32 的性能。可以看到在光栅化游戏中，NVIDIA GeForce RTX 4070 Founders Edition 显卡的性能实际上跟 3DMark 的测试差不多，与 RTX 3070 Ti 之间的性能相差幅度也就在 10-15% 上下，而《荒野大镖客 2：救赎》的领先幅度更是不到 10%。

　　温度和功耗

　　除了游戏性能更加出色之外，Ada 架构带来的优势还在于惊艳的能效，也就是说在提供更加出色的图形性能之外，在温度和能耗上的表现也更加地出色。我们自然也测试了在不同条件下的温度能耗的表现，通过 FrameView 进行记录。

　　通过对于 3DMark 以及《赛博朋克 2077》的性能测试可以看到，NVIDIA GeForce RTX 4070 Founders Edition 显卡的领先幅度可以说相当地巨大，功耗领先幅度在 80W 左右，而温度也可以领先 8 摄氏度，显然这跟高能效比的核心有很大的关系，除此之外，厂商对于散热器散热性能的冗余也导致实际温度表现比预期的更加出色。

　　生产力测试

　　如果说 2K 游戏只是这块显卡的一部分的话，那么从去年年底开始爆火的 AIGC 则组成了 NVIDIA GeForce RTX 4070 Founder Edition 显卡的另一部分，如果说过去的生产力仅仅指的是传统的利用 GPU 算力从事的视频渲染等任务，那么新一代的生产力就应该是借助 AI 来协助用户创造更大的工作价值。因此目前越来越多的 AIGC 创作软件营运而生，从而让英伟达的 AI 性能有的放矢。其中包括 Stable Diffusion、RTX 视频超分辨率等应用场景。

　　Stable Diffusion

　　Stable Diffusion 是一款非常受欢迎的开源图像生成模型，可以借助扩散模型生成海量的图片，极大地减轻了画家的作图时间，从而提升效率。当然早期的 AI 作图还相当地稚嫩，出现大量不符合构造的图片，不过如今随着模型的不断优化，AI 作图也日渐成熟，从而制造出符合大家审美需求的图片，而 Stable Diffusion 模型目前基本上仅支持 CUDA，因为也成为了英伟达显卡的专属。

　　在这里我选择了 Stable Diffusion GRisk GUI 进行测试，事实上想要实现 AI 画图也不是一件难事。比如说你需要增加众多的特征参数，来让你的图片满足你的需求。而这也是目前比较火热的一个职业，参数指定师。当设定了海量的参数之后，按下 Render，随后图片就开始生成。

　　可以看到的是在 AI 合成图片的过程中，GPU 基本上都是处于 100% 的状态，此外得益于出色的 AI 性能，实际上 RTX4070 只要 10 余秒便可以作出一副完整的图片，以满足你的需求，对于绘画一窍不通的用户来说，借助 Stable Diffusion 模型打造的绘画图软件无疑是一种超级神器。

　　RTX 视频超分辨率

　　我们在看视频的时候，尤其是在线视频，经常会出现画面不清晰的时候，特别是片源清晰度过低，导致用户的观影体验受到极大的影响，过去消费者面对这种方法显然束手无策，不过现在用户可以借助显卡实现画面的优化，从而提升你的观影体验。比如说英伟达在 RTX 显卡上实装了 RTX 视频增强。

　　在安装了最新的驱动之后，你可以在英伟达的视频设置中找到 RTX 视频增强，可以选择超分辨率，从而让显卡实现视频的清晰化，其中 4 档的效果最为出色。

　　如果你开启了超分特效之后，通过 Chrome 收看 Youtube、bilibili 等主流视频网站的视频，那么英伟达的显卡就会自动运算，通过超分来让视频更加清晰，从而让视频显示更多的细节，当然打开超分之后，显卡的负载也一下子达到了 50% 左右。

　　通过对比可以看到，在开启 RTX 视频增强之后，F1 赛车的画面更加地平滑，锯齿也得到了有效地缓解，字体也更加清晰，只是这种画面上的区别基本上需要通过暂停画面才可以直观地感受到，对于收看直播尤其是体育类直播的观众来说，RTX 视频增强只能称得上是锦上添花。

　　除了在线视频网站之外，你也可以通过本地视频播放软件来使用 RTX 视频增强功能，比如说最新版本的 VLC 软件就可以支持 RTX 视频增强，当然与视频在线播放相差不大，视频的画面表现略有提升，代价就是需要花费 30-50% 左右的 GPU 资源。

　　AV1 视频编码

　　目前直播的分辨率越来越高，传统的 H265 编码已经不能满足日益庞大的数据传输，此时 AV1 编码应运而生，逐渐开始被主流的影像制作工作室所接受。相比较 H265，AV1 编码能够保持画面几乎不变的情况下，让视频的码率有所下降，同时大幅减少视频的体积。目前在达芬奇 18 等主流视频制作软件中均已增加了对于 AV1 编码的支持。

　　不过对于国内用户来说，目前大红大紫的剪映也实现对于 AV1 视频编码的支持，对于剪辑小白来说也更加友好。

　　我们也使用剪映输出一段 4K 视频，根据剪映预估的大小，基于 AV1 编码下的视频体积为 385M，而基于 H264 下的视频体积为 513M。当然两个视频实际文件大小均有所提升。通过实际文件对比，AV1 下的编码体积大约是 H264 的 77%，实际画面也没有几乎没有什么损失，对于减少视频大小还是很有用的。

　　总结

　　毫无疑问作为一款承上启下的中高端显卡，NVIDIA GeForce RTX 4070 Founders Edition 显卡的实际表现还是让人感到满意的。尽管在传统的光栅化游戏上，相比较上一代性能提升不是很明显，但是在光追游戏以及 DLSS 特效加持下，NVIDIA GeForce RTX 4070 Founders Edition 显卡的表现就远超上代 RTX 3070 Ti，此外英伟达也多次强调这款显卡主要面向的消费群体是 2K 分辨率的用户，那么开启 DLSS 之后，这款显卡也能在获得超过 100 帧的成绩，对于购买了高刷的消费者来说是一个福音。并且在提供更高性能的同时，显卡的功耗以及温度也让人十分地满意。

　　我们也看到，如今大红大紫的 AIGC 对于显卡的 AI 性能提出了更高的要求，而 AI 性能的飞跃也是 RTX 40 系显卡的另外一个亮点，借助强大的 AI 性能表现，用户的工作效率也得到了巨大的飞跃，从而让效益更高。

　　此外在 AI 软件中，毫无疑问英伟达占据了绝大部分的市场份额，这也是未来 NVIDIA GeForce RTX 4070 Founders Edition 显卡以及英伟达所拥有的巨大优势，毕竟 AI 属于专业计算领域，对 RTX 40 系显卡来说也有着更加广阔的发展空间。对于游戏玩家来说，NVIDIA GeForce RTX 4070 Founders Edition 显卡显然是全新的万元装机的首选，毕竟借助 DLSS 3 等各种黑科技，在 2K 分辨率下可以获得超 100 帧的速率，对于拥有 RTX 2070 SUPER 显卡的消息来说是一个相当不错的更新换代的选择。