华为超节点架构：如何重塑AI算力新范式并赋能全场景智能？

智能化浪潮下的算力挑战与新范式

当前，人工智能技术正以惊人的速度演进，深刻改变着千行百业。从复杂的深度学习模型训练到实时的推理应用，对算力的需求呈现爆发式增长。然而，传统的服务器堆叠模式在面对大规模AI计算任务时，逐渐暴露出其局限性，例如集群规模越大，算力利用率反而可能越低，且训练中断的频率也随之升高，严重制约了AI应用的发展效率与稳定性。为了突破这一瓶颈，业界亟需一种能够提供高效、稳定且可线性扩展的全新算力架构。

在2025年的华为全联接大会上，华为董事、ICT BG CEO杨超斌发表了题为“超节点架构创新，开源开放共筑全场景算力底座”的主题演讲，正式宣布推出创新的超节点架构。这一架构被视为重新定义大规模有效算力新范式的重要里程碑，旨在为全场景智能计算提供坚实的基础支持。

超节点架构的核心创新：灵衢互联与“逻辑一体化”

超节点架构的核心在于其引入的灵衢互联协议。这项创新协议使得多台物理计算机器能够实现前所未有的深度互联。这种深度互联并非简单的网络连接，而是在逻辑层面将这些独立的机器融合成一个统一的整体，使其能够像一台机器一样进行学习、思考与推理。这种“逻辑一体化”的计算模式，显著提升了分布式计算任务的协同效率与整体性能。

这一创举彻底改变了传统服务器集群的工作方式，克服了数据传输瓶颈和资源碎片化的问题。通过统一的协议和内存编址，超节点架构确保了计算资源能够被高效池化和调度，从而实现有效算力随集群规模的线性扩展，极大地提高了大规模AI模型训练的效率和成功率。

超节点架构的三大关键特性

华为开创的超节点架构，凭借其独特的创新优势，展现出三大关键特性：

资源池化（Resource Pooling）：通过灵衢协议，计算、存储单元实现大带宽、低时延的深度互联，使得原本分散的资源能够被高效地整合和统一管理。这不仅提升了资源利用率，也为大规模AI模型提供了更灵活、更充裕的计算与存储空间。
规模扩展（Scalability）：超节点架构实现了有效算力随集群规模的线性增长。在传统的集群模式下，随着节点数量的增加，算力利用率往往会下降。而超节点则通过消除互联瓶颈，保证了性能的持续扩展，满足了AI模型参数量不断增长对更大算力的需求。
长稳可靠（Long-term Stability & Reliability）：深度互联和统一调度机制大幅提升了集群的整体可靠性。这意味着AI训练任务能够更加稳定地运行，减少了因节点故障或通信中断导致的训练中断频率，确保了关键业务的连续性。

这些特性共同构成了超节点架构在AI时代的核心竞争力，使其成为支撑未来智能化发展的重要基石。目前，基于超节点架构的Atlas 900 A3 SuperPoD已累计部署300多套，在互联网、金融、运营商、电力、制造等20多个行业客户中展现出卓越的性能和稳定性。

华为全系列超节点产品矩阵

在本次全联接大会上，华为进一步发布了基于灵衢和超节点架构的全新产品系列，以满足不同场景下的多样化算力需求：

Atlas 950 SuperPoD（全液冷数据中心AI超节点）：作为面向超大型AI计算任务的理想选择，Atlas 950 SuperPoD在基础器件、协议算法和光电技术上实现了系统级创新突破。它采用正交架构，通过零线缆电互联提升可靠性；液冷接头浮动盲插设计确保零漏液；独创材料和工艺使光模块液冷可靠性提升一倍。其创新的UB-Mesh递归直连拓扑网络架构支持单板内、单板间和机架间的NPU全互联，能够以64卡为步长按需扩展，最大可实现8192卡无收敛全互联的惊人规模。
Atlas 850（企业级风冷AI超节点服务器）：这是业界首个企业级风冷AI超节点服务器，内部搭载8张昇腾NPU，有效满足企业在模型后训练、多场景推理等方面的需求。Atlas 850支持多柜灵活部署，最大可形成128台1024卡的超节点集群，是目前业内唯一可在风冷机房实现超节点架构的算力集群，为企业级用户提供了兼顾性能与部署便利性的解决方案。
Atlas 350标卡（AI新一代标卡）：采用最新的昇腾950PR芯片，Atlas 350的向量算力提升2倍，支持更细粒度的Cacheline访问，在推荐推理场景可实现2.5倍的性能提升。它具备单卡独立运行的能力，并支持4个灵衢端口互联，进一步实现算力、内存等资源的池化，使更大参数模型、更低时延应用得以在单卡层面上实现。
TaiShan 950 SuperPoD（业界首个通算超节点）：华为推出的这款通算超节点，具备百纳秒级的超低时延、TB级的超大带宽以及内存池化能力。它能够显著提升数据库、虚拟机热迁移和大数据分析等传统计算场景的业务性能，为通用计算性能的跃升开辟了全新的路径。

这些多样化的超节点产品，共同构筑了华为在全场景算力领域的领先地位，为不同规模和需求的客户提供了定制化的智能算力解决方案。华为发布AI超节点服务器Atlas 850，支持128台1024卡超节点集群

开放共赢：共筑全场景算力生态

华为深知生态合作对于技术普惠和产业发展的重要性。因此，华为在超节点架构上坚持硬件开放、软件开源的策略，旨在与产业界共享技术红利，共同推动超节点技术走向更广阔的应用。

在硬件开放层面，华为全面开放了灵衢协议和超节点参考架构，鼓励产业伙伴基于这些技术规范自主研发相关产品或部件。同时，华为还开放了超节点的基础硬件，包括NPU模组、风冷刀片、液冷刀片、AI标卡、CPU主板和级联卡等多种形态，方便客户和伙伴进行增量开发，设计出基于灵衢的各类创新产品。这种开放策略降低了进入门槛，激发了全产业链的创新活力。

在软件开源层面，超节点架构的稳定运行离不开操作系统的深度支持。华为宣布将超节点操作系统中的灵衢组件全部开源，其组件代码将陆续合入openEuler等多个上游操作系统开源社区。这意味着用户可以根据实际需求，将部分或全部源代码集成到现有操作系统中，自行迭代维护版本，或者直接将整个组件合入现有操作系统，并与开源社区版本保持同步演进。此外，昇腾CANN计算架构全面开源开放，Mind系列组件也同步开源，并优先支持PyTorch、vLLM等业界主流开源社区，极大地加速了开发者的灵活高效自主创新，进一步繁荣了AI计算生态。

展望智能时代：坚实算力底座赋能未来

智能化的浪潮正以不可逆转之势重塑着全球的经济与社会格局。华为通过开创性的超节点架构，不仅提供了强大的技术支撑，更以开放共享的姿态，携手全球客户与伙伴，共同构建坚实的全场景算力底座。这不仅是对当前算力挑战的积极回应，更是对未来智能世界愿景的深刻承诺。

在未来的发展中，超节点架构有望在各行各业激发出更多的创新应用，从科学研究的突破到工业生产的优化，从智慧城市的建设到个性化服务的提升，都将从中获益。华为将持续坚持技术创新与开放合作，与生态伙伴一道，共同迎接智能时代的挑战与机遇，共赢数字化、智能化转型的广阔前景。