华为超节点架构:如何重塑AI算力新范式并赋能全场景智能?

1

智能化浪潮下的算力挑战与新范式

当前,人工智能技术正以惊人的速度演进,深刻改变着千行百业。从复杂的深度学习模型训练到实时的推理应用,对算力的需求呈现爆发式增长。然而,传统的服务器堆叠模式在面对大规模AI计算任务时,逐渐暴露出其局限性,例如集群规模越大,算力利用率反而可能越低,且训练中断的频率也随之升高,严重制约了AI应用的发展效率与稳定性。为了突破这一瓶颈,业界亟需一种能够提供高效、稳定且可线性扩展的全新算力架构。

在2025年的华为全联接大会上,华为董事、ICT BG CEO杨超斌发表了题为“超节点架构创新,开源开放共筑全场景算力底座”的主题演讲,正式宣布推出创新的超节点架构。这一架构被视为重新定义大规模有效算力新范式的重要里程碑,旨在为全场景智能计算提供坚实的基础支持。

超节点架构的核心创新:灵衢互联与“逻辑一体化”

超节点架构的核心在于其引入的灵衢互联协议。这项创新协议使得多台物理计算机器能够实现前所未有的深度互联。这种深度互联并非简单的网络连接,而是在逻辑层面将这些独立的机器融合成一个统一的整体,使其能够像一台机器一样进行学习、思考与推理。这种“逻辑一体化”的计算模式,显著提升了分布式计算任务的协同效率与整体性能。

这一创举彻底改变了传统服务器集群的工作方式,克服了数据传输瓶颈和资源碎片化的问题。通过统一的协议和内存编址,超节点架构确保了计算资源能够被高效池化和调度,从而实现有效算力随集群规模的线性扩展,极大地提高了大规模AI模型训练的效率和成功率。

超节点架构的三大关键特性

华为开创的超节点架构,凭借其独特的创新优势,展现出三大关键特性:

  1. 资源池化(Resource Pooling):通过灵衢协议,计算、存储单元实现大带宽、低时延的深度互联,使得原本分散的资源能够被高效地整合和统一管理。这不仅提升了资源利用率,也为大规模AI模型提供了更灵活、更充裕的计算与存储空间。
  2. 规模扩展(Scalability):超节点架构实现了有效算力随集群规模的线性增长。在传统的集群模式下,随着节点数量的增加,算力利用率往往会下降。而超节点则通过消除互联瓶颈,保证了性能的持续扩展,满足了AI模型参数量不断增长对更大算力的需求。
  3. 长稳可靠(Long-term Stability & Reliability):深度互联和统一调度机制大幅提升了集群的整体可靠性。这意味着AI训练任务能够更加稳定地运行,减少了因节点故障或通信中断导致的训练中断频率,确保了关键业务的连续性。

这些特性共同构成了超节点架构在AI时代的核心竞争力,使其成为支撑未来智能化发展的重要基石。目前,基于超节点架构的Atlas 900 A3 SuperPoD已累计部署300多套,在互联网、金融、运营商、电力、制造等20多个行业客户中展现出卓越的性能和稳定性。

华为全系列超节点产品矩阵

在本次全联接大会上,华为进一步发布了基于灵衢和超节点架构的全新产品系列,以满足不同场景下的多样化算力需求:

  • Atlas 950 SuperPoD(全液冷数据中心AI超节点):作为面向超大型AI计算任务的理想选择,Atlas 950 SuperPoD在基础器件、协议算法和光电技术上实现了系统级创新突破。它采用正交架构,通过零线缆电互联提升可靠性;液冷接头浮动盲插设计确保零漏液;独创材料和工艺使光模块液冷可靠性提升一倍。其创新的UB-Mesh递归直连拓扑网络架构支持单板内、单板间和机架间的NPU全互联,能够以64卡为步长按需扩展,最大可实现8192卡无收敛全互联的惊人规模。

  • Atlas 850(企业级风冷AI超节点服务器):这是业界首个企业级风冷AI超节点服务器,内部搭载8张昇腾NPU,有效满足企业在模型后训练、多场景推理等方面的需求。Atlas 850支持多柜灵活部署,最大可形成128台1024卡的超节点集群,是目前业内唯一可在风冷机房实现超节点架构的算力集群,为企业级用户提供了兼顾性能与部署便利性的解决方案。 华为发布AI超节点服务器Atlas 850,支持128台1024卡超节点集群

  • Atlas 350标卡(AI新一代标卡):采用最新的昇腾950PR芯片,Atlas 350的向量算力提升2倍,支持更细粒度的Cacheline访问,在推荐推理场景可实现2.5倍的性能提升。它具备单卡独立运行的能力,并支持4个灵衢端口互联,进一步实现算力、内存等资源的池化,使更大参数模型、更低时延应用得以在单卡层面上实现。

  • TaiShan 950 SuperPoD(业界首个通算超节点):华为推出的这款通算超节点,具备百纳秒级的超低时延、TB级的超大带宽以及内存池化能力。它能够显著提升数据库、虚拟机热迁移和大数据分析等传统计算场景的业务性能,为通用计算性能的跃升开辟了全新的路径。

这些多样化的超节点产品,共同构筑了华为在全场景算力领域的领先地位,为不同规模和需求的客户提供了定制化的智能算力解决方案。 华为发布AI超节点服务器Atlas 850,支持128台1024卡超节点集群

开放共赢:共筑全场景算力生态

华为深知生态合作对于技术普惠和产业发展的重要性。因此,华为在超节点架构上坚持硬件开放、软件开源的策略,旨在与产业界共享技术红利,共同推动超节点技术走向更广阔的应用。

硬件开放层面,华为全面开放了灵衢协议和超节点参考架构,鼓励产业伙伴基于这些技术规范自主研发相关产品或部件。同时,华为还开放了超节点的基础硬件,包括NPU模组、风冷刀片、液冷刀片、AI标卡、CPU主板和级联卡等多种形态,方便客户和伙伴进行增量开发,设计出基于灵衢的各类创新产品。这种开放策略降低了进入门槛,激发了全产业链的创新活力。

软件开源层面,超节点架构的稳定运行离不开操作系统的深度支持。华为宣布将超节点操作系统中的灵衢组件全部开源,其组件代码将陆续合入openEuler等多个上游操作系统开源社区。这意味着用户可以根据实际需求,将部分或全部源代码集成到现有操作系统中,自行迭代维护版本,或者直接将整个组件合入现有操作系统,并与开源社区版本保持同步演进。此外,昇腾CANN计算架构全面开源开放,Mind系列组件也同步开源,并优先支持PyTorch、vLLM等业界主流开源社区,极大地加速了开发者的灵活高效自主创新,进一步繁荣了AI计算生态。

展望智能时代:坚实算力底座赋能未来

智能化的浪潮正以不可逆转之势重塑着全球的经济与社会格局。华为通过开创性的超节点架构,不仅提供了强大的技术支撑,更以开放共享的姿态,携手全球客户与伙伴,共同构建坚实的全场景算力底座。这不仅是对当前算力挑战的积极回应,更是对未来智能世界愿景的深刻承诺。

在未来的发展中,超节点架构有望在各行各业激发出更多的创新应用,从科学研究的突破到工业生产的优化,从智慧城市的建设到个性化服务的提升,都将从中获益。华为将持续坚持技术创新与开放合作,与生态伙伴一道,共同迎接智能时代的挑战与机遇,共赢数字化、智能化转型的广阔前景。