英伟达推Rubin CPX AI芯片,博通OpenAI联手挑战
AI导读:
英伟达推出专为长上下文设计的Rubin CPX GPU,提升AI推理效率。博通获大客户芯片订单,或与OpenAI合作挑战英伟达。英伟达财报显示收入增长,毛利率下滑。
全球人工智能算力芯片龙头英伟达(NVDA,股价:170.760美元;总市值:4.15万亿美元)周二宣布,推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。这款AI芯片新品,无疑将为AI领域带来新的变革。
英伟达CEO黄仁勋表示,CPX是首款专为需要一次性处理大量知识(数百万级别tokens),并进行人工智能推理的模型而构建的芯片。Rubin就是英伟达将在明年发售的下一代顶级算力芯片,基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。
英伟达透露,搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能,能比当前旗舰机架GB300 NVL72高出最多6.5倍。据悉,下一代旗舰机架将提供8exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍。同时单个机架就能提供100TB的高速内存和1.7PB/s的内存带宽,性能提升显著。
作为行业首创之举,英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。推理过程包括两个截然不同的阶段:上下文阶段与生成阶段,两者对基础设施的要求本质上完全不同。Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化,具备30petaFLOPs的NVFP4算力、128GB GDDR7内存。
英伟达估计,大约有20%的AI应用会“坐等”首个token出现。例如解码10万行代码可能需要5-10分钟。而多帧、多秒的视频,预处理和逐帧嵌入会迅速增加延迟,这也是为什么当前的视频大模型通常仅用于制作短片。英伟达计划以两种形式提供Rubin CPX,一种是与Vera Rubin装在同一个托盘上,对于已经下单NVL144的用户,英伟达也会单独出售一整个机架的CPX芯片。
美国东部时间8月27日美股盘后,英伟达发布2026财年第二季度财报。第二季度,英伟达收入达到467亿美元,超过此前市场预期的461亿美元,比去年同期增长55%;净利润(按美国标准会计准则GAAP衡量)为264亿美元,同比增长60%。毛利率则有所下滑,该季度为72.4%,去年同期为75.2%。
4日,博通盘后公布的第三财季业绩超出预期,并为第四财季提供了强劲的指引。公司预计,第四财季的人工智能芯片业务继续提速。在财报电话会上,博通首席执行官陈福阳(Hock Tan)表示,公司已从一家神秘的新客户那里获得了100亿美元的定制芯片订单,业内人士透露,这名新客户极大可能就是人工智能领军企业OpenAI——消息称,OpenAI与博通共同设计的芯片将在明年首次上市,以减少对英伟达产品的依赖。
Clearstead Advisors高管Jim Awad表示,投资者需要准备好面对英伟达在该领域出现更多竞争的局面,但由于AI市场本身的快速扩张,即便失去部分市场份额,公司依然能保持稳定增长。“我认为这(英伟达股价下跌)只是膝跳反应,不是卖出的理由,”Awad说道,“关键要看博通和OpenAI接下来的执行情况,目前没人能在一夜之间夺走英伟达的生意。”每日经济新闻综合英伟达、公开信息(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

