揭秘:Google如何一年内将AI查询能耗狂降33倍,引领绿色智能新范式?

1

近年来,全球范围内对人工智能(AI)的需求激增,这无疑推动了数据中心建设的蓬勃发展,但同时也引发了对AI能耗及其环境影响的广泛担忧。据统计,美国电力消耗在持续几十年平稳后,近期年增长率接近4%,部分原因正归咎于AI数据中心的需求。更令人不安的是,为满足这一激增需求,燃煤发电在一些地区甚至有所增加,使得AI的环保形象蒙上阴影。

然而,准确评估AI的真实环境足迹并非易事。学术研究虽能测试单个AI模型的功耗,却难以将其精确推算至大规模实际应用场景。这主要是因为缺乏对数据中心内部操作细节的洞察,例如硬件利用率、AI查询服务频率等关键数据。在这方面,谷歌凭借其大规模真实世界数据,为我们提供了难得的内部视角。

谷歌近期发布的一份关于AI环境影响的深度分析报告,揭示了其在能耗优化方面的显著进展。报告指出,仅仅在过去一年中,谷歌已成功将每项AI查询的能源消耗降低了惊人的33倍,这表明AI的能源效率正处于一个快速进化的动态过程中。

AI能耗分析的核心挑战与考量

在进行任何能耗分析时,如何界定计算范围是关键。一项AI请求的能耗不仅包括处理器在处理请求时直接消耗的能量,还涉及支持这些处理器的内存、存储、散热系统以及数据中心基础设施的整体能耗。更宏观地看,硬件制造和设施建设所需的能量,以及模型训练阶段的巨大能耗,都应被纳入考量。过去的研究往往因数据获取限制,不得不忽略部分因素,例如硬件生产的碳排放或特定任务所需的处理器数量。

与此不同,谷歌坐拥其庞大数据中心的全部运营数据,包括每次服务请求的能耗、所需硬件资源、散热需求乃至电力供应相关的碳排放,以及硬件生产过程中的间接排放。这份报告的分析范围涵盖了CPU、专用AI加速器和内存的能耗,无论是处理查询时的活跃状态还是查询间的空闲状态。同时,它还追踪了数据中心整体的能源和水资源使用情况,并估算其中用于AI服务的比例。

值得注意的是,本次分析并未涵盖所有可能的环境影响。例如,网络传输请求和返回结果的能耗,以及终端用户设备(从高性能游戏台式机到智能手机)的计算负载,均因其高度可变性而被排除在外。此外,模型训练阶段的能耗,尽管谷歌无疑拥有相关数据并能进行合理估算,也未被计入当前的单次查询能耗评估中。尽管如此,谷歌通过对24小时内请求及其服务硬件的追踪,以及对硬件空闲时间的监测,提供了一个基于中位数提示的每请求能耗评估。

能耗效率的显著跃升

基于这些严谨的估算,谷歌得出结论:一次中位数Gemini Apps文本提示的能耗仅为0.24瓦时,产生0.03克二氧化碳当量(gCO2e),并消耗0.26毫升(约五滴)水。形象地说,其能耗与观看大约9秒电视所消耗的能量相当。单个查询的影响虽然看似微乎其微,但考虑到谷歌将AI操作融入每一次搜索请求中,这种计算需求的量级无疑是巨大的,因此累积效应依然不可小觑。

然而,好消息是,如果没有过去一年的显著能效提升,目前的累积影响将会糟糕得多。这些进步的取得,部分得益于外部环境的改善。例如,随着美国及其他地区太阳能发电的蓬勃发展,谷歌更容易获得可再生能源,这使得每单位能源消耗的碳排放量在过去一年中减少了1.4倍。但更主要的胜利来自于软件层面,不同的优化方法带来了每提示能耗33倍的惊人下降。

AI加速器、CPU、RAM、空闲机器和开销的能耗百分比图

上图清晰展示,在处理AI请求时,定制加速器芯片的能耗占据了绝大部分,其次是CPU和RAM。空闲机器和整体开销也各有约10%的占比。这表明对AI加速器的优化是提升整体效率的关键。

谷歌团队详细描述了促成这一巨大进步的几项关键优化措施。其中之一是“专家混合模型”(Mixture-of-Experts, MoE)方法,它能够根据特定请求仅激活AI模型中必要的部分,从而将计算需求降低10到100倍。此外,谷歌还开发了其主模型的紧凑版本,进一步减轻了计算负荷。高效的数据中心管理也发挥了重要作用,确保活跃硬件得到充分利用,同时允许其他设备维持低功耗状态。

谷歌在AI能效方面拥有独特的优势,因为它自行设计定制的AI加速器,并负责运行在这些硬件上的软件架构。这种软硬件协同优化的能力,使得双方能够完美契合,发挥最大效能。考虑到AI加速器活动占据了查询总能耗的一半以上,这种整合能力显得尤为关键。谷歌在运营高效数据中心方面积累的丰富经验,也自然延伸到了AI领域。

综合这些因素,谷歌估计其典型文本查询的能耗在过去一年里降低了33倍。这种效率的提升产生了连锁效应:例如,与硬件制造相关的碳排放成本被稀释了,因为相同硬件在其使用寿命内能够处理更多的查询。谷歌没有将这一成果仅仅作为公关手段,而是以一份类似于学术出版物的形式,详细阐述了其方法论和考量。这表明其背后团队希望推动行业内广泛采用这种或类似的全面测量框架。他们呼吁:“我们倡导广泛采纳此种或类似全面的测量框架,以确保随着AI能力的进步,其环境效率也能同步提升。”这无疑为AI技术未来发展指明了方向,即在追求强大功能的同时,必须将环境可持续性置于核心地位。