大模型参数量的指数级增长与多模态数据语料的爆发式膨胀,正以前所未有的速度推动着人工智能技术迈向新的高度。从早期的GPT-3到如今的万亿级MoE模型,我们见证了参数规模的持续突破;同时,训练数据也从单一文本扩展至图像、音频、视频,甚至生物序列和4D时空标签,其增长速度以惊人的“月翻倍”态势向前推进。据国家数据局统计,截至2025年6月,我国每日Token消耗量已飙升至30万亿,在短短一年半的时间内实现了300倍的惊人增幅。面对这种数据洪流,传统存储系统在算力需求节节攀升的同时,也遭遇了前所未有的存力挑战:既要确保海量数据能够高效存储,又要保证数据访问速度能够满足高并发、低时延的AI工作负载需求,同时还要兼顾总体拥有成本的经济性。这使得传统存储架构在AI面前显得力不从心,尤其是在当前复杂的地缘政治格局和供应链不确定性背景下,如何构建一个自主可控、高效且经济的数据基础设施,已然成为中国AI产业在迈向智能化进程中必须正面回应的战略性命题。
AI时代:存储介质革新势在必行
人工智能的崛起,让数据的重要性被重新定义。随着AI大模型从研发实验室走向千行万业的生产实践,数据规模的几何级增长已成为常态。数据的读写效率不再仅仅是技术指标,而是直接关乎企业生产力效能和市场竞争力的核心要素。数据的安全可靠存储,更是成为企业核心数字资产管理的基础。正如“AI之父”杰弗里·辛顿所强调的,机器智能之所以可能超越人类智能,很大程度上在于其拥有“永久的记忆”。这深刻揭示了“存储”在AI舞台上的核心地位,它不再是后端辅助环节,而是智能系统运行效率与智能水平提升的关键支撑。华为公司副总裁、数据存储产品线总裁周跃峰博士也指出,AI若要实现商业上的良性循环,必须从系统整体的效率和性价比进行综合考量与优化。他进一步强调,缺乏强大的“记忆力”支撑,即便拥有最聪明的“大脑”,也难以发挥其真正的潜力,而日益凸显的“内存墙”和“容量墙”问题,已成为制约AI训练和推理效率、影响用户体验的关键瓶颈。
“内存墙”是一个在半导体领域存在已久的概念,但在大模型时代,其严峻性被前所未有地放大,甚至达到了影响“生死存亡”的程度。以一个拥有6710亿参数的稠密模型为例,仅其KV Cache(键值缓存)就需要高达13.4 TB的显存。然而,目前一台主流的8卡国产训推一体机所搭载的HBM(高带宽内存)总容量往往不足1TB,两者之间存在巨大的鸿沟。这种内存缺口并非简单地通过“加卡”就能弥补,因为功耗限制、主板面积约束以及供应链的诸多限制共同构筑了一道无形的峡谷。HBM虽然性能卓越,但其高昂的成本和有限的容量限制了其大规模应用,加之某些国家对其出口和制造的严格管制,使其供应面临不确定性。另一方面,传统的SSD虽然在容量上有所改善,但在面对AI工作负载所要求的高并发、低时延推理场景时,其性能瓶颈显而易见。而机械硬盘(HDD)在性能和能效上更是难以望其项背。因此,在AI时代,我们迫切需要一场深层次的存储介质应用创新革命,以突破现有技术瓶颈,满足不断增长的AI需求。
华为AI SSD:构筑AI商业正循环的核心驱动力
面对AI时代存储介质的巨大变革需求,华为凭借其在ICT领域超过30年的深厚技术积累和丰富实践经验,攻克了诸多技术难关,倾力打造出面向AI时代的高端固态硬盘产品。在华为的定义中,AI SSD是专为优化AI工作负载而设计的高性能、大容量固态硬盘,其核心目标是显著提升AI训练效率和推理体验,有效降低每Token的运行成本,并深度加固AI数据的可靠性。AI SSD主要分为两大类:一类是性能导向型硬盘,旨在向上突破“内存墙”的限制;另一类是容量导向型硬盘,旨在向下打破“容量墙”的瓶颈。作为一套系统化的解决方案组合,华为此次推出的OceanDisk系列AI SSD新品涵盖了极致性能盘、高性能盘和大容量盘,分别精准匹配内存扩展、推理加速和海量数据存储这三大核心场景。
OceanDisk EX 560:极致性能与内存扩展的理想之选
OceanDisk EX 560作为华为AI SSD系列的旗舰产品,代表了存储性能的极致追求。它拥有高达1500K IOPS的随机写入性能,以及低至7微秒的超低时延,同时具备DWPD(每日全盘写入次数)高达60的卓越耐久性。这款产品主要面向AI训练和高频推理等对性能要求极为严苛的场景。通过与HBM等高带宽内存协同工作,EX 560能够显著扩展系统的有效内存容量,尤其适用于千亿级参数大模型的微调训练和高速缓存应用,有效缓解“内存墙”带来的压力。
OceanDisk SP 560:高性能与高性价比的黄金平衡
OceanDisk SP 560则是在性能与成本之间找到了绝佳的平衡点。它提供了最高600K IOPS的随机写入性能,同样实现了7微秒的低时延,而DWPD则为1,使其在保证高性能的同时,拥有更具竞争力的成本优势。SP 560在AI推理场景中展现出卓越的性能优势,据测试数据显示,它能将序列长度提升2.5倍,将首Token时延降低75%,并使整体吞吐率提升2.7倍。这些显著的性能提升使其在多个行业应用中实现了批量商用,为AI推理业务带来了实实在在的效率飞跃。
OceanDisk LC 560:超大容量与高效存储的革新典范
对于需要海量数据存储和高效预处理的场景,OceanDisk LC 560提供了颠覆性的解决方案。单盘物理容量最高可达245TB,读带宽高达14.7GB/s。更为重要的是,其重构时间从传统存储的1.5天大幅缩短至仅8小时,极大地提升了数据中心的运维效率和可靠性。LC 560旨在替代传统的机械硬盘(HDD),显著提升大型语料库的存储密度与预处理效率,特别适合于大规模AI训练集群中原始数据和中间结果的存储管理。
除了硬件上的创新,华为还同步推出了DiskBooster驱动软件,实现了AI SSD与HBM、DDR内存的智能协同。通过先进的内存扩展技术,该软件能够将虚拟池化内存容量扩大20倍,极大缓解了显存容量不足的问题。同时,DiskBooster还具备智能多流技术,与上层应用紧密配合,有效降低了SSD的写放大效应,从而显著延长了AI SSD的使用寿命,进一步提升了整体存储系统的经济性与可靠性。
变革背后:底层技术创新与系统级突破
华为AI SSD的卓越性能和创新应用并非偶然,其背后是一系列底层关键技术的集体突破。这些技术不仅体现了华为在存储介质应用层面的深厚创新能力,更反映出其以系统级思维来构建未来AI存储架构的战略远见。在华为看来,存储不再是孤立的硬件部件,而是与算力、网络、算法紧密融合、相互赋能的关键模块。
XtremeLink硬件架构:释放协议极限带宽
XtremeLink硬件架构是华为AI SSD实现超高性能的核心之一。通过软硬件深度协同、IO路径全硬化以及集成硬件加速引擎,该架构能够最大限度地释放SSD协议的极限带宽。结合端到端智能算法,系统能够快速找到最优数据传输路径,使得顺序读写性能和随机IOPS均能逼近理论极限值,确保了AI工作负载所需的高吞吐和低时延。
SpeedFlex PCB与32Die堆叠技术:兼顾容量与性能
在容量密度方面,华为采用了创新的SpeedFlex PCB(印刷电路板)设计和32Die高密度堆叠技术。通过刚柔结合的PCB设计,实现了更高密度的元器件集成和信号完整性优化,使得单盘物理容量能够达到惊人的245TB,同时还支持7200兆的信号速率。这项技术在兼顾超大容量的同时,也确保了数据的快速传输和响应速度,打破了传统大容量存储在性能上的固有瓶颈。
DiskBooster驱动:智能内存池化与寿命提升
DiskBooster驱动软件不仅仅是一个简单的硬件驱动,更是一个智能化的存储管理平台。它支持内存池化技术,能够将AI SSD的存储空间虚拟化为更大的内存池,与HBM和DDR内存形成协同,实现虚拟内存20倍的扩展,有效缓解了“内存墙”问题。此外,其智能多流调度技术能够对来自不同应用的IO流进行精细分类和优化,从而显著降低SSD的写放大效应,将AI SSD的预期寿命提升一倍,为用户带来更长久、更可靠的使用体验。
隔水仓技术:提升数据可靠性与重构效率
针对大容量存储系统的可靠性挑战,华为创新性地引入了“隔水仓”技术。该技术将大容量盘的内部存储空间进行逻辑分区,当某个分区发生故障时,仅影响局部区域的数据,而不是整个硬盘。这使得故障数据的重构时间从传统的1.5天大幅缩短至8小时,仅为原来的1/4。这种局部分区和快速重构机制,极大地提升了整个存储系统的可用性和数据可靠性,降低了因故障而导致的服务中断风险。
展望未来:HBM与AI SSD的智能协同
华为深信,未来的AI存储架构将是一个由HBM、DRAM与AI SSD智能协同构成的多层级体系。通过对存储层级的深度优化和智能数据调度,可以形成一个高效的三层缓存架构:HBM作为最顶层的极速缓存,DRAM作为第二层的高速缓存,而AI SSD则作为第三层的性能与容量兼顾的存储池。这种分层协同不仅能够在性能、容量和成本之间找到最佳平衡点,还能充分发挥每种介质的优势,实现数据在不同存储层级之间的智能流动和高效利用。过去,我们谈及AI落地时,普遍的担忧集中在算力是否充足。然而,在实际的AI应用落地过程中,人们逐渐发现,真正的瓶颈往往在于数据能否及时、高效地跟上算力的需求。华为AI SSD的发布,无疑为突破这一长期困扰AI产业的瓶颈带来了曙光。尤其对于当前面临外部技术封锁挑战的中国AI产业而言,华为通过提供更高效、更经济、更自主可控的存储解决方案,为中国AI技术和产业的快速发展注入了强大动能,使其在自主创新之路上能够走得更快、更稳健,从而在全球AI竞争格局中占据更为有利的位置。