
好意思东时分9月9日周二欧洲杯体育,英伟达发布新一代Rubin CPX芯片系统,特意针对AI视频生成和软件诱惑等大范围高下文处置任务,强化AI编码和视频处置才调。
Rubin CPX定于2026年底上市,罗致卡片形势,可集成到现存奇迹器想象中或当作寂然狡计修复在数据中心驱动。
这款芯片系统在时代规格上达成紧要破裂。Rubin CPX GPU提供30千万亿次浮点(petaflops)运算才调(NVFP4精度),配备128GB GDDR7内存,撑执视频解码和编码的硬件,比拟英伟达GB300 NVL72系统,能干力加快3倍。
齐全的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,提供8 exaflops AI性能,性能为英伟达GB300 NVL72系统的7.5倍。
英伟达CEO黄仁勋暗示,Rubin CPX是首款专为百万级token处置而构建的CUDA GPU。他说:
"正如RTX改动性地改变了图形和物理AI,Rubin CPX是首款专为大范围高下文AI而构建的CUDA GPU,模子不错同期进行数百万个常识token的推理。"
英伟达声称,新芯片的投资报恩率达到30至50倍,部署价值1亿好意思元的新芯片硬件将为客户带来高达50亿好意思元收入,即从1亿好意思元的本钱开销中赢得高达50亿好意思元的收入。该预测强调了英伟达对AI基础花式生意价值的量化悉力。
时代创新:区别式推理架构擢升恶果Rubin CPX罗致区别式推理架构,将AI狡计过程分为高下文阶段和生成阶段。高下文阶段需要高概述量狡计来处置宽广输入数据,而生成阶段则依赖快速内存传输和高速互连。
这种想象允许两个阶段寂然处置,达成狡计和内存资源的精确优化。Rubin CPX特意针对狡计密集型的高下文阶段进行优化,与现存基础花式协同职责,提供3倍的能干力加快性能。
该平台配备100TB高速内存和每秒1.7千万亿字节的内存带宽,通过英伟达Quantum-X800 InfiniBand或Spectrum-X以太网说合,由Dynamo平台结伙调和。
应用场景:重塑软件诱惑和视频生成在软件诱惑鸿沟,Rubin CPX使AI系统概况处置系数代码库,抠门跨文献依赖关连,领路仓库级结构。这将编程助手从自动完成器具转动为智能调和伙伴,概况领路"大范围软件样式"。
视频生成方面,该系统可在单个芯片上完成解码、编码和处置,AI模子概况处置多达100万个token的一小时实践。这为长视频实践生成提供了前所未有的连贯性和缅想才调。
多家公司已抒发合作意向。代码生成公司Cursor贪图使用该时代进行代码生成,视频创作平台Runway将其应用于视频生成职责进程,AI议论公司Magic则贪图诳骗该时代构建具有1亿token高下文窗口的基础模子。
商场影响:安适英伟达AI基础花式上风Rubin CPX的发布进一步安适了英伟达在AI基础花式鸿沟的当先地位。据分析师臆测,英伟达的数据中心业务本财年收入有望达到1840亿好意思元,跳动业内其他公司的总收入。
该家具体现了英伟达在硬件和软件创新方面的执续参加,这种速率是竞争敌手尚未匹及的。通过特意针对特定AI职责负载优化硬件,英伟达不息保执行业对其家具的依赖。
新平台展望将为企业构建下一代生成式AI应用创造新的可能性欧洲杯体育,格外是在需要处置大范围高下文的高价值推理用例中。这记号着AI基础花式从通用狡计向专用优化的迫切转动。
风险提醒及免责条件 商场有风险,投资需严慎。本文不组成个东说念主投资提出,也未商量到个别用户极端的投资筹划、财务情状或需要。用户应试虑本文中的任何想法、不雅点或论断是否适应其特定情状。据此投资,包袱昌盛。