英伟达推Rubin CPX AI芯片，博通OpenAI联手挑战

国内财经 2025-09-10 13:55:44 来源：每日经济新闻作者：网络

AI导读：

英伟达推出专为长上下文设计的Rubin CPX GPU，提升AI推理效率。博通获大客户芯片订单，或与OpenAI合作挑战英伟达。英伟达财报显示收入增长，毛利率下滑。

　　全球人工智能算力芯片龙头英伟达（NVDA，股价：170.760美元；总市值：4.15万亿美元）周二宣布，推出专为长上下文工作负载设计的专用GPU Rubin CPX，用于翻倍提升当前AI推理运算的工作效率，特别是编程、视频生成等需要超长上下文窗口的应用。这款AI芯片新品，无疑将为AI领域带来新的变革。

　　英伟达CEO黄仁勋表示，CPX是首款专为需要一次性处理大量知识（数百万级别tokens），并进行人工智能推理的模型而构建的芯片。Rubin就是英伟达将在明年发售的下一代顶级算力芯片，基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。

　　英伟达透露，搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能，能比当前旗舰机架GB300 NVL72高出最多6.5倍。据悉，下一代旗舰机架将提供8exaFLOPs的NVFP4算力，比GB300 NVL72高出7.5倍。同时单个机架就能提供100TB的高速内存和1.7PB/s的内存带宽，性能提升显著。

　　作为行业首创之举，英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。推理过程包括两个截然不同的阶段：上下文阶段与生成阶段，两者对基础设施的要求本质上完全不同。Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化，具备30petaFLOPs的NVFP4算力、128GB GDDR7内存。

　　英伟达估计，大约有20%的AI应用会“坐等”首个token出现。例如解码10万行代码可能需要5-10分钟。而多帧、多秒的视频，预处理和逐帧嵌入会迅速增加延迟，这也是为什么当前的视频大模型通常仅用于制作短片。英伟达计划以两种形式提供Rubin CPX，一种是与Vera Rubin装在同一个托盘上，对于已经下单NVL144的用户，英伟达也会单独出售一整个机架的CPX芯片。

　　美国东部时间8月27日美股盘后，英伟达发布2026财年第二季度财报。第二季度，英伟达收入达到467亿美元，超过此前市场预期的461亿美元，比去年同期增长55%；净利润（按美国标准会计准则GAAP衡量）为264亿美元，同比增长60%。毛利率则有所下滑，该季度为72.4%，去年同期为75.2%。

　　4日，博通盘后公布的第三财季业绩超出预期，并为第四财季提供了强劲的指引。公司预计，第四财季的人工智能芯片业务继续提速。在财报电话会上，博通首席执行官陈福阳（Hock Tan）表示，公司已从一家神秘的新客户那里获得了100亿美元的定制芯片订单，业内人士透露，这名新客户极大可能就是人工智能领军企业OpenAI——消息称，OpenAI与博通共同设计的芯片将在明年首次上市，以减少对英伟达产品的依赖。

　　Clearstead Advisors高管Jim Awad表示，投资者需要准备好面对英伟达在该领域出现更多竞争的局面，但由于AI市场本身的快速扩张，即便失去部分市场份额，公司依然能保持稳定增长。“我认为这（英伟达股价下跌）只是膝跳反应，不是卖出的理由，”Awad说道，“关键要看博通和OpenAI接下来的执行情况，目前没人能在一夜之间夺走英伟达的生意。”每日经济新闻综合英伟达、公开信息（文章来源：每日经济新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。