NVIDIA RTX 6000 Ada GPU 最近发布,我们很幸运能够在实验室中获得一个进行一些扩展测试。 Ada Lovelace 架构彻底重新定义了 GPU 性能格局。 这款强大的显卡定位为 NVIDIA 的旗舰产品,它取代了 RTX A6000,后者本身就是一个强大且仍然非常相关的前身。
然而,命名法表面上的相似掩盖了幕后进步的分水岭。 这两款 GPU 都出现在备受瞩目的评测中:我们的 RTX 6000 Ada 戴尔Precision 7960 回顾和RTX A6000 HP Z6 G5 和 联想Thinkstation PX.
NVIDIA RTX 6000 Ada 对比 NVIDIA RTX A6000
乍一看,RTX 6000 Ada 及其前身 RTX A6000 具有相似的规格:48GB GDDR6 内存、4 个 DisplayPort 1.4a 输出、300W TDP 和相同的外形尺寸。 然而,深入研究揭示了一个巨大的转变。 RTX 6000 Ada 是 NVIDIA Ada Lovelace 架构中的一款旗舰产品,与根植于 Ampere 架构的 RTX A6000 形成鲜明对比。
规格 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
架构 | Ada Lovelace | Ampere | ||
Cuda 核心 | 18,176 | 10,752 | ||
内存大小 | 48GB GDDR6 | 48GB GDDR6 | ||
显存位宽 | 384-bit | 384-bit | ||
内存带宽 | 960GB /秒 | 768GB /秒 | ||
GPU 显示连接器 | 4x DisplayPort 1.4a | 4x DisplayPort 1.4a | ||
显示输出 | 4x 4096 x 2160 @ 120 Hz 4x 5120 x 2880 @ 60 Hz 2x 7680 x 4320 @ 60 Hz | 4x 4096 x 2160 @ 120 Hz 4x 5120 x 2880 @ 60 Hz 2x 7680 x 4320 @ 60 Hz | ||
光线追踪 | 第三代 | 第二代 | ||
光线追踪 (RT) 核心 | 142 | 84 | ||
Tensor Core Generation | 第四代 | 第三代 | ||
Tensor核心 | 568 | 336 | ||
单精度性能 | 91.1 Teraflops | 38.7 Teraflops | ||
RT核心性能 | 210.6 Teraflops | 75.6 Teraflops | ||
Tensor性能 | 1457.0 Teraflops | 309.7 Teraflops | ||
NVLink | 没有 | 有 | ||
电源连接器 | 1 个 PCIe CEM5 16 针 | 1x 8 针 CPU | ||
测试时的价格(美元) | $6,800 | $4,650 |
当您深入了解架构的复杂性时,差异就会成为焦点。 Cuda 核心数量、内存带宽、光线追踪 (RT) 核心和张量核心都倾向于 RTX 6000 Ada。 值得注意的是,它拥有惊人的 18,176 个 Cuda 核心,超过了 RTX A6000 的 10,752 个。 但这不仅仅是原始数据的问题,还涉及这些规格差异如何转化为现实世界中可测量的性能指标。 让我们开始讨论实际问题吧。
NVIDIA RTX 6000 Ada 性能基准
为了评估这些 GPU 的比较能力,我们在我们的内部精心策划了一个双核 GPU TYAN Transport HX FT65T-B8050 测试台,配备了新发布的AMD EPYC GenoaX 96核心CPU。 事实证明,该平台在最大限度地减少瓶颈方面稳健可靠。 我们通过此方法交换了 GPU,以保持所有环境变量相同,从而仅将 GPU 视为变量。
测试台主要规格
■ AMD Genoa-X 9684X
■ 8 个 64GB 金士顿 DDR5-5600
■ Solidigm P41 Plus (21x 1TB)
■ Solidigm P5430 15.36TB
■ Windows Server 2022
■ NVIDIA 生产分支驱动程序 537.58
SPECviewperf 2020
SPECviewperf 2020 基准测试是测量 OpenGL 和 Direct X 应用程序编程接口下专业应用程序图形性能的全球标准。 视图集(或基准)代表实际应用程序的图形内容和行为,而无需安装应用程序本身。 这些视图集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。 数字越高越好。
在其中一些测试中,RTX 6000 ADA 的得分比 A6000 高出 2 倍,但其他测试的得分则稍接近一些。
视图集 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
3dsmax-07 | 208.75 | 137.15 | ||
Catia-06 | 129.27 | 101.31 | ||
Creo-03 | 176.18 | 141.58 | ||
Energy-03 | 88.62 | 43.1 | ||
Maya-06 | 529.54 | 341.36 | ||
Medical-03 | 131.12 | 68.33 | ||
Snx-04 | 928.91 | NA | ||
Solidworks-05 | 291.22 | 168.18 |
ESRI
接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商。 Esri 的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。 此应用程序使用“ZoomToBookmarks”功能浏览各种预定义的书签,并创建一个日志文件,其中包含预测用户体验所需的所有关键数据点。 该脚本自动循环书签三次以说明缓存(内存和磁盘缓存)。 换句话说,该基准模拟了人们可能会通过 Esri 的 ArcGIS Pro 软件看到的大量图形使用。
测试由三个主要数据集组成。 两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。 这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。 第三个数据集是俄勒冈州波特兰地区的二维地图视图。 此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山体阴影地形的详细信息。
首先是蒙特利尔动画。 6000 Ada 立即展现了其优于 A6000 的优势,结果高出 25%。
ESRI ArcGIS Pro 2.3 蒙特利尔 | ||
平均 FPS | 平均数 | |
NVIDIA RTX 6000 Ada | 755.37 | |
NVIDIA RTX A6000 | 582.63 | |
最低帧率 | 平均数 | |
NVIDIA RTX 6000 Ada | 344.52 | |
NVIDIA RTX A6000 | 283.24 |
接下来是费城视图集,RTX 6000 Ada 继续保持卓越性能,性能提高了约 21%。
ESRI ArcGIS Pro 2.3 费城 | ||
平均 FPS | 平均数 | |
NVIDIA RTX 6000 Ada | 573.89 | |
NVIDIA RTX A6000 | 461.57 | |
最低帧率 | 平均数 | |
NVIDIA RTX 6000 Ada | 298.33 | |
NVIDIA RTX A6000 | 256.25 |
最后是波特兰,RTX 6000 Ada 和 RTX A6000 的表现非常接近,因为该子测试受 CPU 限制。
ESRI ArcGIS Pro 2.3 波特兰 | ||
平均 FPS | 平均数 | |
NVIDIA RTX 6000 Ada | 2856.97 | |
NVIDIA RTX A6000 | 2538.71 | |
最低帧率 | 平均数 | |
NVIDIA RTX 6000 Ada | 1256.46 | |
NVIDIA RTX A6000 | 1144.51 |
Luxmark
我们将关注的另一个 3D 基准测试是 LuxMark,一个 OpenCL GPU 基准测试实用程序。 在这次测试中,6000 Ada 的数据确实很出色,在 Hall Bench 上的得分比 A44.7 高出 6000%,在 Food Bench 上的得分高出 58.7%。
LuxMark(越高越好) | ||||
类别 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
大厅长凳 | 32,955 | 20,904 | ||
食品 | 14,515 | 7,927 |
Blender OptiX
接下来是 Blender,一个开源 3D 建模应用程序。 该基准测试使用 Blender Benchmark 实用程序运行,并使用 NVIDIA OptiX 作为所选的渲染方法。 分数以每分钟采样数为单位,越高越好。
NVIDIA RTX6000 Ada 再次展现实力,在 Monster 测试中性能提升了 78.4%,在 Junkshop 测试中提升了 55.1%,在 Classroom 测试中提升了 68.44%。
Blender OptiX,每分钟采样数(越高越好) | ||||
分类 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
怪物 | 6583.80 | 2875.19 | ||
旧货店 | 3016.24 | 1713.68 | ||
课堂 | 3039.30 | 1489.53 |
Blackmagic RAW 速度测试
我们的下一个测试是 Blackmagic RAW 速度测试。 该测试收紧了 6000 Ada 和 A6000 得分,性能差异较小,为 11.7%。
Blackmagic RAW(越高越好) | ||||
NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | |||
8K 图形处理器 | 208 FPS | 185 FPS |
3DMark 测试
我们查看了流行的“游戏玩家”3DMark 基准来衡量总体系统性能,并在我们的工作站上启动它。 RTX 6000 Ada 的 Cuda 计数和时钟速度优势显而易见。
越高越好 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
赛道 | 8,231 | 5,136 | ||
皇家港口 | 19,160 | 12,660 | ||
时间间谍 | 21,180 | 18,451 | ||
时间间谍至尊 | 14,526 | 10,113 | ||
火力打击超 | 19,726 | 12,230 | ||
烈火来袭 | 29,685 | 22,185 |
Geekbench 6
Geekbench 6 是衡量整体系统性能的跨平台基准测试。 该测试可以进行单核CPU评分、多核CPU评分和GPU评分,但我们在本次评测中仅介绍GPU评分。
您可以在以下位置找到与任何您想要的系统的比较 Geekbench浏览器.
Geekbench 6 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
GPU 基准测试——OpenCL | 357,349 | 211,091 |
GPU Pi
GPU Pi 测试显示 GPU 计算一组 PI 位数的速度。 我们已将其设置为计算 32 亿位数字,其中包含 20 万位数字批次和 512 次缩减。 这里越低越好,因为测量单位是秒。 6000 Ada 在此测试中的表现提高了 69.2%。
GPU Pi 32b,20M 批量,512 缩减(越低越好) | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
计算 | 69.541s | 142.873s | ||
减少 | 6.146s | 12.828s | ||
合计 | 75.687s | 155.701s |
Cinebench R24
我们的最终测试将是 Cinebench 2024,我们最近将其添加到我们的测试方案中。 更新之间的显着差异是 Cinebench 现在具有 GPU 测试结果,如下所列。 我们在本次评测中排除了 CPU 评分。 在这次最终测试中,6000 Ada 比 A6000 显示出显着的优势,性能差异达 55.75%。
Cinebench 2024(越高越好) | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
GPU | 30,213 | 17,041 |
电源测试
随着 NVIDIA RTX 6000 Ada 性能的巨大提升,了解对功耗的影响也很重要。 考虑到这一点,我们利用我们的 Quarch IEC 电源功率分析模块。 在这里,我们测量了空闲时的基本系统功耗,然后使用 Luxmark 加载该卡以进行负载下测量。 在空闲和负载情况下,新款 RTX 6000 都实现了可测量的功耗节省,考虑到该卡提供的显着性能提升,这一点令人印象深刻。
系统功耗 | NVIDIA RTX 6000 Ada | NVIDIA RTX A6000 | ||
空闲 | 255.1W | 262.9W | ||
负荷 | 552.5W | 567.1W |
结论
NVIDIA RTX 6000 Ada 不仅是 RTX A6000 工作站 GPU 的后继产品,而且还是 RTX A6000 工作站 GPU 的后继产品。 这是一次全面的检修。 规格表和物理相似性可能暗示着渐进式改进,但请不要误会:这款 GPU 已经改变了游戏。 更好的是,它在相同的功率范围内实现了巨大的性能飞跃,与 AXNUMX 相比,每瓦性能更高。
NVIDIA RTX 6000 Ada 不仅继承了“最佳工作站 GPU”的称号,而且还继承了“最佳工作站 GPU”的称号。 它以惊人的性能指标和前瞻性的架构赢得了这一荣誉。 RTX A6000 已正式传递火炬,RTX 6000 Ada 高度重视,使其成为我们“2023 年最佳”认可的明确选择。