近年来,人工智能的爆发式增长深刻改变了全球技术格局,但随之而来的能耗问题也引发了广泛关注。特别是在美国,经历了数十年的电力使用量平稳期后,近期用电量激增近4%,这与数据中心的快速扩张及其承载的AI工作负载密切相关。令人担忧的是,部分新增电力需求甚至通过燃煤发电来满足,使得AI的环保形象蒙上阴影。由于缺乏具体运营数据,学术界难以准确评估AI的实际环境影响。
然而,作为AI领域的巨头,谷歌拥有海量的真实世界数据。其近期发布的一份关于AI环境影响的深入分析报告,为我们提供了难得的内部视角。这份分析表明,AI能耗评估是一个动态变化的目标,谷歌数据显示,过去一年中,其AI查询的能耗已大幅降低了33倍。
综合考量:AI能耗分析的范畴与挑战
在进行能耗分析时,一个核心问题是确定哪些因素应该被纳入考量。显然,处理器在处理请求时的能耗是其中之一,但支持这些处理器所需的内存、存储、散热以及其他基础设施的能耗同样不可忽视。更进一步,硬件制造、设施建设的能量投入,以及模型训练阶段的巨额能耗,都可能按比例分摊到每个模型部署后的请求中。
过往的许多分析往往因数据获取限制而省略了部分因素,例如,分析者可能无法得知特定任务需要多少专用处理器,更不用说这些硬件生产过程中的碳排放。相较之下,谷歌凭借其端到端的技术栈,能够全面获取以下数据:服务请求的能量消耗、所需硬件配置、散热需求,以及数据中心整体的能源和水资源使用情况。通过精确划分数据中心内AI服务的份额,并追踪电网的碳排放强度及硬件生产相关的排放,谷歌能够提供更为全面的评估。其分析纳入了CPU、专用AI加速器和内存的活跃及空闲能耗,并进一步考虑了数据中心整体的能源和水资源消耗。
值得注意的是,谷歌的分析中并未涵盖所有潜在因素。例如,用于接收请求和传递结果的网络传输能耗被排除在外,因为其变化幅度较大。同样,终端用户硬件的计算负载也被忽略,因其在游戏级桌面电脑和智能手机之间存在巨大差异。然而,有一个本可以被合理估算但未被包含的重要因素是模型训练的影响。尽管谷歌无疑了解其模型训练的巨大能耗,并能够估算模型的有效寿命及其处理的请求数量,但这项成本并未计入当前的AI查询能耗评估中。
为得出典型数值,分析团队追踪了24小时内请求及其服务硬件的使用情况,包括硬件的空闲时间。这使得他们能够估算出每次请求的能耗,该能耗因所使用的模型而异。每天,他们识别中位数提示,并以此来计算环境影响。
显著成效:能耗直线下降的背后驱动力
基于这些严谨的估算,谷歌发现单个文本请求的能耗极低。报告指出:“我们估算,一次中位数Gemini应用文本提示消耗0.24瓦时(Wh)的能量,产生0.03克二氧化碳当量(gCO2e),并消耗0.26毫升(约五滴)水。” 为了更直观地理解,他们估算其能耗与观看约9秒电视相当。尽管单个请求影响微乎其微,但考虑到谷歌已选择在每一次搜索请求中执行AI操作,其累计的计算需求无疑是巨大的,因此总体成本仍不容小觑。
然而,积极的进展是,这一局面相比一年前已有了天壤之别。谷歌能效显著提升的原因是多方面的。一方面,美国及其他地区太阳能发电的蓬勃发展,使得谷歌更容易获得可再生电力。这导致过去一年中,每单位能源消耗的碳排放量减少了1.4倍。更关键的突破则源于软件层面,不同的优化方法带来了每提示能耗高达33倍的惊人下降。
上图显示了AI服务请求的主要能耗来源,定制加速器芯片占据了最大份额,其次是CPU和RAM。空闲机器和开销也各占约10%的比例,这表明了硬件利用率和待机管理的优化潜力。
谷歌团队详细阐述了公司为此所做的多项优化。其中一项核心技术是“混合专家”(Mixture-of-Experts)方法,它能够仅激活AI模型中处理特定请求所需的部分,从而将计算需求降低10到100倍。此外,他们还开发了多个主模型的紧凑版本,进一步减轻了计算负担。数据中心管理也发挥了重要作用,通过确保活跃硬件得到充分利用,同时让其余硬件保持低功耗状态,最大化了资源效率。
另一个关键优势在于谷歌自行设计定制的AI加速器,并针对其运行的软件进行架构优化。这种软硬件协同设计使得两者能够实现最佳配合。这一点尤为重要,因为AI加速器上的活动占据了查询总能耗的一半以上。同时,谷歌在运营高效数据中心方面积累的丰富经验也成功地迁移到了AI领域。
行业展望与未来呼吁
所有这些努力的综合结果是,谷歌估算其典型文本查询的能耗在过去一年中下降了33倍。这种效率提升产生了连锁反应,例如,与硬件制造相关的碳排放成本被稀释,因为同一硬件在其有效寿命内能够处理更多的查询。谷歌本可以将其成果单纯作为公关宣传,但其选择详细阐述了研究方法和考量因素,使之更像一份学术出版物。这种开放的态度源于该团队希望推动业界广泛采纳其方法。他们总结道:“我们倡导广泛采用这种或类似的综合测量框架,以确保随着AI能力的进步,其环境效率也能同步提升。”
谷歌的案例为整个AI行业树立了重要的标杆,证明了在追求AI技术突破的同时,实现环境可持续性是完全可行的。面对全球日益增长的能源压力和气候变化挑战,这种对能效的持续关注和技术创新,将是推动AI健康、负责任发展的关键动力。未来,随着更多企业采纳类似的透明测量和优化策略,我们有望共同构建一个更加绿色、高效的AI生态系统。