千呼万唤,英伟达 RTX 50 系列终于正式官宣。

在刚刚结束的 CES 2025 主题演讲中,黄仁勋身着新皮衣揭开了 RTX 5090 的面纱,闲言少叙,直接来看性能与售价:

  • 迄今为止速度最快的 GeForce RTX GPU

  • 拥有 920 亿个晶体管,提供 3,352 TOPS 的计算能力

  • 性能是 GeForce RTX 4090 GPU 的 2 倍

  • 对于台式机用户,配备 3,352 AI TOPS 的 GeForce RTX 5090 GPU 和 1,801 AI TOPS 的 GeForce RTX 5080 GPU 将于 1 月 30 日上市,售价分别为 1,999 美元(约合人民币 14,651 元)和 999 美元(约合人民币 7,322 元) ::: hljs-center

在这里插入图片描述

:::

配置提前曝光,售价果然上涨

2024 年 9 月中旬,一则「GeForce RTX 4090 和 RTX 4090D 将于 10 月停产」的消息不胫而走,这款「孤独求败」的性能猛兽一直稳坐高端显卡的头把交椅,如今被曝出即将停产,一方面引得市场上「囤货」的呼声高涨,另一方面也不禁令人猜测,此举是为即将到来的 RTX 50 系列铺平道路。

早有传言称 RTX 50 系列将在 2025 年初面世,而随着时间节点的临近,这一重大更新的轮廓也逐渐清晰。2024 年圣诞节期间,一张 RTX 5090 PCB 照片突然曝光,并迅速引发热议,其超大号尺寸也令此前传出的 32GB 大显存更加可信。

彼时,黄仁勋在 CES 2025 上的演讲已经宣布定档当地时间 1 月 6 日,所以人们也将其定为 RTX 5090 的首秀日。 ::: hljs-center

在这里插入图片描述

:::

::: hljs-center

社交媒体上疯传的 RTX 5090 PCB

:::

时间来到黄仁勋演讲的前一天,RTX 5090 包装盒照片意外流出,再为其亮相的热度添了一把火。从外媒 VideoCardz 发布的照片来看,此前关于 RTX 5090 将搭载 32GB GDDR7 显存的传闻也首次得到了印证。 ::: hljs-center

在这里插入图片描述

:::

::: hljs-center

外媒报道的 RTX 5090 包装盒

:::

除了性能外,大家最关心的莫过于价格。性能的大幅提升之下,涨价似在情理之中,预测消息显示,RTX 4090 的官方首发价为 1,599 美元,而 RTX 5090 预计将达到 1,999-2,499 美元,折合人民币 14,633-18,294 元。

就在刚刚,悬念正式揭晓。

采用 NVIDIA Blackwell 架构的 RTX 50 系列的最低价格门槛为 549 美元(约合人民币 4,023 元)。有意思的是,黄仁勋在揭晓价格前特别提到了 RTX 4090 的首发价,旨在突出 RTX 5070 以 549 美元就能够达到与 RTX 4090 相媲美的性能。 ::: hljs-center

在这里插入图片描述

:::

万众期待的顶配 RTX 5090 首发价为 1,999 美元,英伟达官方也非常直接地将其定位为「World’s Fastest GPU」。 ::: hljs-center

在这里插入图片描述

:::

性能方面,GeForce RTX 5090 基于 NVIDIA Blackwell 架构,拥有 920 亿个晶体管,提供每秒超过 3,352 TOPS 的计算能力。其采用的 DLSS 4 首次推出了多帧生成技术 (Multi Frame Generation),与 DLSS 技术套件协同工作,可将性能提升至传统渲染技术的 8 倍。

DLSS 4 还引入了图形行业首个 Transformer 模型架构的实时应用。基于 Transformer 的 DLSS Ray Reconstruction 和 Super Resolution 模型,使用多 2 倍的参数和多 4 倍的计算,在游戏场景中提供更高的稳定性与细节渲染。

同时,RTX 5090 还增加了 FP4 支持,可以减小模型尺寸,与上一代产品相比,内存占用空间更小,运行生成式 AI 模型的速度提高了 2 倍。 *与 FP16(大多数模型采用的默认方法)相比,FP4 使用的内存不到一半

举例来看,使用配备 FP16 的 GeForce RTX 4090,FLUX.1 [dev] 模型可在 15 秒内生成图像,而使用配备 FP4 的 GeForce RTX 5090 则只需 5 秒就能生成图像。 ::: hljs-center

在这里插入图片描述

:::

此外,TRX 50 系列还采用了第九代英伟达编码器,可用于高级视频编辑和直播,并配备英伟达 DLSS 4 和高达 32GB 的 VRAM,可用于处理大型 3D 项目。

具体而言,RTX 5090 搭载 GB202 GPU,内建 21,760 个 CUDA 核心,是第一款超过 20,000 个内核的 GeForce GPU。而次旗舰 RTX 5080 则拥有 1,0752 个 CUDA 核心,搭载 256bit 位宽的 16GB GDDR7 显存,TDP 功耗 360W。

RTX 50 系列官宣后立刻引发热议,英伟达科学家 Jim Fan 为大家划了重点——新卡使用神经网络为你的游戏生成 90% 以上的像素?传统的光线追踪算法只能渲染约 10%,相当于 「粗略草图」,然后由生成模型填充其余的细节。 ::: hljs-center

在这里插入图片描述

:::

RTX 5090 D 已现身中文官网

毫无疑问,新一代性能天花板 RTX 5090 依然与中国市场无缘。

相信大家都知道,受制于美国出口管制,英伟达曾为中国市场定制了「阉割」版 RTX 4090 D。虽然 RTX 4090 D 力争在不违规定的情况下,尽可能地保留接近于 RTX 4090 的性能特点,以提供高性能的游戏体验和 AI 计算能力,但在 AI 推理测试方面,其性能仍然降低约 5% ,但两者的价格基本相近。

具体来说,相比于 RTX 4090,RTX 4090 D 的 CUDA 核心从 16,384 减少到了14,592,Tensor 核心则从 512 降到了 456,均减少大约 11%。这也导致它在图形渲染、物理模拟和 AI 推理方面的表现略逊于原版 RTX 4090。

此外,RTX 4090 D 搭载了与 RTX 4090 相同的 24GB GDDR6X 显存,位宽为 384 位。在总功耗 (TGP) 方面,RTX 4090 D 为 425W,略低于 RTX 4090 的 450W。至于频率设置,RTX 4090 D 的基础频率被提升至 2,280 MHz,高于 RTX 4090 的 2,235 MHz,而两者的加速频率都是 2,520 MHz。

总的来说,RTX 4090 D 基本保持了与 RTX 4090 相似的显存配置和略微提升的频率,但在核心数量和性能上有所降低。

而 RTX 5090 相比 RTX 4090 性能提升 2 倍。不出意外,英伟达仍然会为中国市场定制一款专属的 RTX 5090 D,我们也在其中文官网上发现了 RTX 5090 D 与 RTX 4090 D 的性能区别,如下图所示: ::: hljs-center

在这里插入图片描述

:::

此外,针对大家普遍关心的具体「阉割」了哪些配置,其官网也给出了部分对比,如下图所示,RTX 5090 D 的配置和 RTX 5090 基本一致,主要是限制了显卡在执行 AI 任务时的处理能力,其 AI TOPS(人工智能每秒万亿次操作)从 3,352 减少至 2,375。 ::: hljs-center

在这里插入图片描述

::: ::: hljs-center

在这里插入图片描述

:::

值得一提的是,目前官网仍未标明 RTX 5090 D 的具体价格,相比于 RTX 5090 的 1,999 美元售价,本次的「阉割版」 RTX 5090 D 是否会像上次一样基本不变,我们拭目以待。 ::: hljs-center

在这里插入图片描述

:::