随着生成式人工智能技术的迅猛发展,全球数据中心正经历前所未有的扩张浪潮。然而,这一技术进步的背后,是日益严峻的环境挑战——数据中心能耗与碳排放的急剧增加。据国际能源署2025年4月报告预测,到2030年,全球数据中心用电需求将翻一番,达到约945太瓦时,相当于日本全年的能源消耗。更令人担忧的是,高盛8月分析指出,数据中心新增电力需求的约60%将通过燃烧化石燃料满足,这将导致全球碳排放增加约2.2亿吨。
面对这一严峻形势,麻省理工学院(MIT)及全球各地的科学家和工程师们正积极探索创新解决方案,从算法优化到数据中心设计革新,全方位应对AI系统的碳足迹问题。
双重碳足迹:运营碳与隐含碳
讨论减少生成式AI碳足迹时,人们通常聚焦于"运营碳"——数据中心内部GPU等强大处理器产生的排放。然而,MIT林肯实验室高级科学家Vijay Gadepally指出,这种讨论往往忽略了"隐含碳"——即建造数据中心本身所产生的排放。
"运营碳只是故事的一部分,"Gadepally强调,"我们需要在未来更多地关注隐含碳问题。"
建造和改造数据中心需要消耗大量钢材和混凝土,配备空调单元、计算硬件和数英里长的电缆,这产生了巨大的碳足迹。事实上,数据中心的环境影响促使Meta和谷歌等公司探索更可持续的建筑材料。例如,Meta正在试点使用大规模木材作为数据中心的建设材料,而微软则尝试用木材替代混凝土和钢材。
此外,数据中心是庞大的建筑——全球最大的中国电信-内蒙古信息公园占地约1000万平方英尺,其能源密度是普通办公楼的10到50倍。这些因素共同构成了AI系统的完整碳足迹。
减少运营碳排放的多维策略
硬件优化与能效提升
减少AI数据中心运营碳排放的方法与家庭节能措施有许多相似之处。例如,就像关闭或调暗灯光可以节省能源一样,研究人员发现,将GPU功耗降低到原来的约30%,对AI模型性能的影响微乎其微,同时还能降低硬件冷却需求。
另一种策略是使用能耗更低的计算硬件。训练像GPT-5这样的新推理模型通常需要大量GPU同时工作,高盛分析估计,最先进的系统可能同时运行多达576个互连的GPU。然而,工程师有时可以通过降低计算硬件的精度来实现类似结果,例如切换到经过调优以处理特定AI工作负载的较低性能处理器。
训练过程的能效优化
在部署前提高训练耗电深度学习模型的效率也是重要策略。Gadepally的团队发现,训练AI模型所用电能的一半左右,用于获得最后2-3个百分点的准确度。提前停止训练过程可以节省大量能源。
"在某些情况下,70%的准确度可能足以满足特定应用需求,比如电商推荐系统,"他解释道。
研究人员还可以利用效率提升措施。例如,超级计算中心的一位博士后意识到,在训练过程中可能运行上千次模拟来为项目选择两三个最佳AI模型。通过构建一个工具,避免了约80%这些浪费的计算周期,他们显著降低了训练的能源需求,同时没有降低模型准确度。
效率创新的持续突破
计算硬件的持续创新,如半导体芯片上更密集的晶体管阵列,仍在推动AI模型能效的显著提升。
尽管自2005年以来大多数芯片的能效改进速度已经放缓,但GPU每焦耳能量可以完成的计算量每年仍提高50-60%,MIT计算机科学与人工智能实验室未来技术研究项目主任Neil Thompson指出。
"芯片上不断增加晶体管的'摩尔定律'趋势对这些AI系统仍然很重要,因为并行运行操作对提高效率仍然非常有价值,"Thompson说。
更重要的是,他的团队研究表明,新模型架构带来的效率提升——能够更快解决复杂问题,消耗更少能源达到相同或更好结果——每八到九个月翻一番。Thompson创造了"负浮点运算(negaflop)"这一术语来描述这一效应,类似于"负瓦特"代表节能措施节省的电力,"负浮点运算"是指由于算法改进而不需要执行的运算。
这些技术包括修剪神经网络的不必要组件,或采用压缩技术使用户能够用更少的计算完成更多工作。
"如果你今天需要使用一个非常强大的模型来完成你的任务,再过几年,你可能能够使用一个显著更小的模型来做同样的事情,这将大大减少环境负担。使这些模型更高效是减少AI环境成本最重要的事情,"Thompson强调。
最大化能源节约的智能调度
虽然减少AI算法和计算硬件的整体能源使用将减少温室气体排放,但并非所有能源都相同,Gadepally补充道。
"1千瓦时碳排放在一天中的不同时间,以及一个月和一年中的不同时间,差异相当显著,"他说。
工程师可以利用这些差异,通过利用AI工作负载和数据中心运营的灵活性来最大化减排效果。例如,一些生成式AI工作负载不需要完全同时执行。
将计算操作拆分,让部分操作在更多电力来自太阳能和风能等可再生能源的稍后时间执行,可以显著减少数据中心的碳足迹,MIT能源倡议的研究科学家Deepjyoti Deka表示。
Deka及其团队还在研究"更智能"的数据中心,其中多家使用相同计算设备的公司的AI工作负载被灵活调整以提高能源效率。
"通过将系统作为一个整体来看,我们的目标是最大限度地减少能源使用以及对化石燃料的依赖,同时保持AI公司和用户的可靠性标准,"Deka说。
他和MITEI的其他研究人员正在构建一个数据中心灵活性模型,考虑训练深度学习模型与部署该模型的不同能源需求。他们希望发现最佳策略来安排和简化计算操作以提高能源效率。
研究人员还在探索数据中心使用长期能源存储系统,这些系统可以在需要时储存多余能源。通过这些系统,数据中心可以在高需求期间使用由可再生能源产生的储存能源,或者在电网波动时避免使用柴油备用发电机。
"长期能源存储可能是一个游戏规则改变者,因为我们可以设计真正改变系统排放组合的运营,更多地依赖可再生能源,"Deka说。
此外,MIT和普林斯顿大学的研究人员正在开发一个名为GenX的电力部门投资规划软件工具,可帮助公司确定数据中心的理想位置,以最大限度地减少环境影响和成本。位置选择对减少数据中心的碳足迹有很大影响。例如,Meta在瑞典北部沿海城市吕勒奥运营一个数据中心,那里的较低温度减少了冷却计算硬件所需的电力。
AI驱动的清洁能源解决方案
目前,地球上的可再生能源扩张速度跟不上AI的快速增长,这是减少其碳足迹的一个主要障碍,MIT创业信托中心短期讲师、前气候和能源AI实践负责人Jennifer Turliuk MBA '25表示。
新可再生能源项目所需的当地、州和联邦审查流程可能需要数年时间。
MIT和其他地方的研究人员正在探索使用AI来加速新可再生能源系统接入电网的过程。例如,生成式AI模型可以简化并网研究,确定新项目将如何影响电网,这一步骤通常需要数年才能完成。
在加速清洁能源技术的开发和实施方面,AI也可以发挥重要作用。
"机器学习非常适合处理复杂情况,而电网据说是世界上最大和最复杂的机器之一,"Turliuk补充道。
例如,AI可以帮助优化太阳能和风能发电的预测,或确定新设施的理想位置。它还可用于太阳能电池板或其他绿色能源基础设施的预测性维护和故障检测,或监控传输线的容量以最大化效率。
通过帮助研究人员收集和分析大量数据,AI还可以为有针对性的政策干预提供信息,旨在从可再生能源等领域获得最大的"投资回报",Turliuk说。
为了帮助政策制定者、科学家和企业考虑AI系统的多方面成本和效益,她和她的合作者开发了净气候影响评分(Net Climate Impact Score)。该评分是一个框架,可用于帮助确定AI项目的净气候影响,考虑排放和其他环境成本以及未来的潜在环境效益。
协作与创新的关键作用
归根结底,最有效的解决方案可能来自于公司、监管机构和研究人员之间的合作,而学术界将引领这一进程,Turliuk补充道。
"每一天都很重要。我们正走在一条道路上,气候变化的影响将在我们无法采取任何行动之前才被完全了解。这是创新并使AI系统碳强度降低的一次性机会,"她说。
随着AI技术的不断发展,其环境影响问题需要从多角度进行思考和解决。通过技术创新、政策引导和行业协作,我们有信心在享受AI带来便利的同时,也能将其对环境的影响降至最低,实现技术发展与环境保护的双赢局面。
结语
AI技术的环境挑战既是问题也是机遇。正如研究人员所指出的,这是一个"一生一次的机会",通过创新使AI系统更加低碳。从算法优化到能源调度,从硬件设计到政策制定,每一个环节的创新都将为AI的可持续发展贡献力量。随着技术的进步和认识的深入,我们有理由相信,AI与环境保护将不再是零和游戏,而是能够相互促进、共同发展的伙伴关系。