英伟达近日发布了一款名为 Rubin CPX 的新设备,这款产品是专为处理大量信息而设计的 GPU。它能够胜任像大规模视频生成和数据编码等复杂任务。这款硬件的功能在于将解析 AI 指令与生成结果的过程分开,从而提升整体效率。
Rubin CPX 是 Vera Rubin 平台的一部分,这个平台同时包括了 Vera CPU 和 Rubin GPU。据称,全机架版本的 Vera Rubin NVL144 CPX 具备 8 exaflops 的 AI 处理能力。
该 GPU 配备了 128GB 的 GDDR7 显存。英伟达表示,相比以往产品,它的注意力机制提升了三倍,并且采用 4-bit NVFP4 精度,能提供 30 petaflops 的计算性能。
英伟达 CEO 黄仁勋将 Rubin CPX 与 RTX 进行了对比,他表示,这款 GPU 是首款专门针对大规模上下文 AI 设计的 CUDA 芯片,可以同时处理数百万个知识单元。他还提到,投资 1 亿美元部署该硬件,可能带来 50 亿美元的收益。
这款设备会配合英伟达的软件系统使用,其中包括 Nemotron 系列多模态模型。这些模型适用于不同规模的应用,从小型设备到大型数据中心都有对应的版本。
Rubin CPX 计划在 2026 年底正式上市。