在电商行业的发展历程中,2025年的双十一无疑是一个具有里程碑意义的时刻。当六亿用户同时涌入平台,当购物高峰从传统的晚间8点扩展至午间12点与晚间8点的双峰格局,当AI技术全面渗透购物全流程,这场年度盛事已不仅仅是一场促销活动,更成为了一次全球最大规模的AI应用实践。
技术革新:从资源保卫战到算力突破
VPC瓶颈的创造性解决方案
今年8月,淘宝闪购、飞猪、饿了么并入电商事业群的业务整合,为即将到来的双十一带来了前所未有的挑战。外卖需求激增导致日订单峰值突破1.2亿单,直接拉动手淘日活用户增长20%。更关键的是,双十一大促周期提前至10月下旬,留给技术团队准备的时间仅有短短两个月。
面对VPC(虚拟私有云)内转发网关承载量急剧上升的困境,阿里云技术团队面临两种选择:传统的VPC拆分方案或创新性的200万VPC级联方案。前者如同将城市按行政区强行割裂,需要深度梳理集团业务需求,两个月时间显然不够用;后者则是将马路升级为飞机跑道,难度同样不小。

阿里云团队最终选择了更具挑战性的创新路径,迅速组建攻坚小组,提出「云网关级联方案」。这一方案基于软硬协同技术,通过在网关层扩展多级流表、打通超大VPC的逻辑互联,在不影响现有业务的前提下,成功将单VPC容量提升至200万,提前化解了双十一的网络瓶颈危机。
千万核CPU集群的算力革命
VPC瓶颈的突破,如同打开了算力世界的潘多拉魔盒。基于第八代和第九代ECS实例的业内首个千万核CPU集群得以组网。通过统一资源池加智能调度层的架构设计,阿里云实现了算力的精准分配与高效利用,成功支撑起天猫双11和闪购两大业务的双峰流量洪峰。
随着CIPU(云基础设施处理器)的不断演进和规模化部署,今年双十一上线了千万核CPU算力,标志着阿里云基于CIPU架构的算力进入了全新发展阶段。这一技术突破直接转化为用户体验的显著提升:APP打开更顺畅,推荐、营销等核心场景性能提升30%-50%,RT延时降低超30%,每一次添加、删除操作都能即时反馈。
AI全面渗透:从消费者到商家的智能化变革
全球首个AI全面落地的双十一
如果说2023年是大模型元年,那么2025年双十一就是这场AI革命的超级练兵场。它不仅考验云在海量数据高并发情况下对多元异构算力的高效调度,更检验AI在大规模生产场景的可靠程度与实际效用。

今年双十一,AI技术全面渗透各个环节,被认为是首个AI全面落地的双十一。从消费者端的「AI万能搜」「AI帮我挑」,到商家端的智能客服、经营分析,再到平台端的搜索、推荐引擎体系,大模型在整个电商体系中占据了举足轻重的地位。
商家侧的AI生产力革命
在商家侧,AI正在成为重要的生产工具。淘宝基于Qwen3家族多款模型打造和升级了生意管家、店小蜜等应用。以生意管家为例,其AI数据分析师为商家提供经营数据分析,可覆盖90%的中小商家核心分析场景,大幅提升分析和决策效率;全新升级的店小蜜能精准连贯理解用户意图、调用平台以及商家工单系统、自动化处理售后问题。
面向商品出海场景,包括通义Qwen-MT在内的多个翻译模型,支持了淘宝出海的商品翻译需求。通过采用混合专家架构与服务调度优化,Qwen-MT单次调用延迟降低40%,为全球用户提供快速、精准、稳定的翻译服务。今年双11,该模型系统支持了亿级商品的图片、评价、商品详情等翻译任务,单日调用量超14亿次。
智算调度:AI落地的关键胜负手
要在淘宝这个数亿用户的超级APP上支撑如此大规模的AI应用,智算调度成为决胜关键。阿里云团队设计了多级亲和性与拓扑感知调度方案,实现了卡间互联路径更短、带宽更优,为双十一提供个性化、高效的AI算力服务。
多级亲和性调度算法按照NC/交换机/机柜/楼宇/AZ的多层分级,为AI任务规划出最短的算力通勤路线,让GPU卡间的数据传输效率大大提升;拓扑感知技术则时刻扫描网络状态,一旦发现拥塞链路,瞬间为数据重新导航,确保卡时在线率,杜绝任何一丝算力浪费。
灵骏智算深度融合阿里云十余年来在计算、存储与网络虚拟化领域的技术积累,通过系统级的集成与优化,提供稳定、高性能的存储能力与云网络访问能力。最终,灵骏万卡集群在双11期间实现了业界领先的卡时在线率表现,为首个AI大规模落地的双11打好了最稳的地基。
战略布局:从全栈AI到能力溢出
全栈人工智能服务商的定位
双十一的全栈AI检验对阿里而言只是小试牛刀,事实上阿里描绘的AI蓝图更为宏大。今年,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在多个场合表态,阿里巴巴正在积极推进三年3800亿的AI基础设施建设计划,并将会持续追加更大的投入。
在这个长期规划中,阿里云的定位非常清晰——全栈人工智能服务商。在模型层面,通义千问坚定开源开放路线,核心目的是打造"AI时代的Android",并成为AI生态的基础平台。截至目前,通义千问共开源300多个模型,全球下载量突破6亿次,衍生模型超17万个,超越美国Llama大模型系列,位居全球第一。
AI超级计算机的构建
在基础设施层面,阿里云全力打造一台全新的AI超级计算机,灵骏智算集群则是这台超级计算机的关键一环。当前,以灵骏为代表的智算产品早已渗透千行百业AI场景,例如自动驾驶是阿里云AI落地进度最快的核心场景之一,市场份额占据绝对优势,绝大部分主流车企、金融企业、物流企业均为其客户。
根据IDC的最新报告,2024年中国AI基础设施(AI IaaS)市场份额,阿里云占比23%,位列中国市场第一,超过第二名和第三名总和;在生成式AI基础设施领域,阿里云取得模型训练和模型推理市场的双项冠军。
前瞻性建设的战略意义
这些投入短期来看不仅换来了绝对领先的市场地位,也换来了包括200万VPC以及超千万核CPU调度能力在内的超级能力建设。尽管短期内不会再有如此大体量的单一用户和如此盛大的全民参与活动,但这正是云服务基础设施的意义所在。

站在AI"生物大爆发"的节点当下,我们无法想象未来,就像半导体发明初期无法预见如今人类的手机、电脑中需要纳米级电路在指甲盖大小塞下上亿电路。而作为基础设施,云平台需要前瞻性建设为业务创新预留技术缓冲带。今天的超级能力建设,是为后续的超级场景埋下的伏笔。
历年的双十一如此,科技产业的历史如此,今年也不会例外。阿里云通过全栈AI能力在双十一的实践,不仅验证了技术的成熟度,更为整个行业的AI落地提供了宝贵的经验和启示。随着这些技术的不断演进和普及,我们有理由相信,未来的购物体验将更加智能化、个性化,而电商行业也将迎来新一轮的创新发展浪潮。











