华为昇腾芯片规划路线揭晓，超节点集群引领AI算力新篇章

国内财经 2025-09-18 18:31:19 来源：财联社作者：网络

AI导读：

华为在全联接大会2025上揭晓昇腾芯片规划，推出Ascend 950/960/970系列，并发布Atlas 950/960超节点及SuperCluster集群，引领AI算力新篇章，为人工智能持续创新提供算力底座。

　　在华为全联接大会2025上，华为轮值董事长徐直军分享了昇腾芯片的规划路线，并推出全球最强超节点和集群，这一举措标志着华为在AI算力领域的重大突破。

　　他透露，未来三年，直至2028年，华为开发和规划了三个系列，分别是Ascend（昇腾）950系列，包括两颗芯片：Ascend950PR和Ascend 950DT，以及Ascend 960、Ascend 970系列，更多具体芯片还在规划中，这些芯片将极大提升AI算力性能。

　　结合已经推出或正在研发中的昇腾芯片，华为将带来更多超节点和集群产品。包括Atlas 950超节点和Atlas 960超节点，分别支持8192张和15488张的昇腾卡，这些超节点将大幅提升AI算力，满足不断增长的AI需求。并将在2027年第四季度，基于Atlas 960超节点同步推出Atlas 960 SuperCluster，集群规模提升到百万卡级。

　　以下为徐直军针对昇腾芯片、超节点和集群的演讲内容，经过《科创板日报》删减和整理：

　　算力的基础是芯片，昇腾芯片是华为AI算力战略的基础。未来3年，至2028年，我们在开发和规划了三个系列，Ascend 950系列新增支持业界标准FP8/MXFP8/MXFP4等低数值精度数据格式，算力分别达到1P和2P，提升训练效率和推理吞吐。

　　目前正在开发、且即将推出的芯片叫Ascend 950系列，包括Ascend 950 PR和Ascend 950 DT。与前一代昇腾芯片相比，Ascend 950在多个方面实现了根本性提升，如大幅度提升了向量算力，互联带宽相比Ascend 910C提升了2.5倍，达到2TB/s。

　　第三颗是在规划中的芯片Ascend 960，在算力、内存访问带宽、内存容量、互联端口数等各种规格上相比Ascend 950翻倍，大幅度提升训练、推理等场景的性能；同时还支持华为自研的HiF4数据格式。它是目前业界最优的4bit精度实现，能进一步提升推理吞吐，并且比业界FP4方案的推理精度更优。Ascend 960将在2027年四季度推出。

　　从大型AI算力基础设施建设的技术方向看，超节点已经成为主导性产品形态。今年3月份，华为正式推出了Atlas 900超节点，满配支持384卡，最大算力可达300 PFLOPS。CloudMatrix384超节点，则是华为云基于Atlas 900超节点构建的云服务实例。

　　结合已经推出或正在研发中的昇腾芯片，将带来更多超节点和集群产品。今天发布的第一款产品——Atlas 950超节点，是基于Ascend 950DT打造。Atlas 950超节点支持8192张基于Ascend 950DT的昇腾卡，是Atlas 900超节点的20多倍。Atlas 950超节点满配包括由128个计算柜、32个互联柜，共计160个机柜组成，占地面积1000平方米左右，柜间采用全光互联。总算力大幅度提升，其中，FP8算力达到8E FLOPS，FP4算力达到16E FLOPS。互联带宽达到16PB/s，这个数字意味着，Atlas 950一个产品的总互联带宽，已经超过今天全球互联网峰值带宽的10倍有余。

　　8192卡超节点并不是终点。今天发布的第二款超节点产品Atlas 960超节点，其基于Ascend 960，最大可支持15488卡。Atlas 960超节点由176个计算柜，44个互联柜，共220个机柜，占地面积约2200平方米。Atlas 960超节点的上市时间是：2027年四季度。基于Ascend 960，Atlas 960超节点总算力、内存容量、互联带宽在Atlas 950基础上再翻倍。其中，FP8总算力将达到30E FLOPS，而FP4总算力将达到60 EFLOPS；内存容量达到4460TB，互联带宽达到34PB/s。大模型训练和推理的性能相比Atlas 950超节点，将分别提升3倍和4倍以上，达到15.9M TPS 和80.5M TPS。

　　为了达成Atlas 950/960超节点对互联的技术要求，华为开创了超节点架构并开创了新型的互联协议，能够支撑万卡级超节点架构。万卡级超节点架构应该具备6大特征，分别是总线级互联、平等协同、全量池化、协议归一、大规模组网、高可用性。我们为这个面向超节点的新型互联协议取名“灵衢”，英文名称：UB，UnifiedBus。今天，我们正式发布灵衢UnifiedBus，一个面向超节点的互联协议。

　　接下来带来两个集群产品：首先是Atlas 950 SuperCluster 50万卡集群。Atlas 950 SuperCluster集群由64个Atlas 950超节点互联组成，把1万多机柜中的52万多片昇腾950DT组成为一个整体，FP8总算力可达524 EFLOPS。上市时间与Atlas 950超节点同步，即2026年Q4。Atlas 950 SuperCluster集群，相比当前世界上最大的集群 xAI Colossus，规模是其2.5倍，算力是其1.3倍，是当之无愧的全世界最强算力集群！无论是当下主流的千亿稠密、稀疏大模型训练任务，还是未来的万亿、十万亿大模型训练，超节点集群都可以成为性能强悍的算力底座，高效稳定地支持人工智能持续创新。

　　在2027年Q4，我们还将基于Atlas 960超节点，同步推出Atlas 960 SuperCluster，集群规模进一步提升到百万卡级，FP8总算力达到2 ZFLOPS，FP4总算力达到4 ZFLOPS。这将持续加速客户应用创新，探索智能水平新高。

（文章来源：财联社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。