
NVIDIA发布全新GPU Rubin CPX,高达百万token推理性能,配备高达128GB显存重磅来袭!
NVIDIA宣布推出全新GPU——Rubin CPX,配备高达128GB显存,拥有出色的推理性能,可处理高达百万级别的token,这款GPU将为专业用户和高性能计算领域带来显著的性能提升,助力推动人工智能、机器学习等领域的快速发展。
9月10日消息,128GB显存的RTX 5090是没有的,不过128GB显存的AI GPU确实有。
我们知道,NVIDIA下一代GPU架构代号Rubin,明年才会正式登场。
但是现在,NVIDIA官方宣布了Rubin CPX,一款专门面向长窗口AI推理、智能体工作负载而打造的上下文处理型GPU。
它基于Rubin架构,单芯片设计,CUDA核心数量没公布,只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流,搭配128GB GDDR7显存。
NVIDIA宣称,它在NVFP4数据精度下,计算性能最高30 PFlops(每秒3亿亿次),可以实现百万级token的推理。
同时,在长上下文处理场景下,它的注意力性能相比GB300 NVL72提升了最高3倍。
Rubin CPX今天只是纸面宣布,正式推出要等到2026年底——你没看错,是明年底。
NVIDIA日前透露,下代Rubin GPU、Vera CPU都已经在台积电完成流片,符合预期。
文章版权及转载声明
作者:访客本文地址:https://jjrbwx.com/jjrbwx/352.html发布于 2025-09-10 13:05:16
文章转载或复制请以超链接形式并注明出处大众参考网
还没有评论,来说两句吧...