近年来,人工智能(AI)技术的飞速发展深刻改变了社会面貌,其对经济、科技乃至日常生活的赋能效应日益显著。然而,在光鲜成就的背后,AI庞大的计算需求所带来的环境成本也逐渐浮出水面,引发了全球范围内的广泛关注。尽管业界对AI的碳足迹和资源消耗有所担忧,但缺乏精确、可靠的数据一直是阻碍深入研究和有效应对的症结。法国人工智能模型开发商Mistral近期发布的一项开创性环境审计报告,正致力于弥补这一数据空白,为量化大型语言模型(LLM)的环境影响提供了宝贵的第一手资料。
Mistral的这份报告被其称为同类首创,旨在全面量化其LLM的环境足迹。报告的结果与此前学术界的估算大体吻合:尽管单个AI查询的环境影响相对较小,但考虑到每年数十亿次的AI交互累积效应,即使是微小的个体影响也可能汇聚成显著的整体环境负担。这提示我们,在享受AI便利的同时,必须正视其潜在的环境代价,并积极寻求可持续发展路径。
量化AI的绿色困境:Mistral审计的深度洞察
为了对其“Large 2”模型在运营近18个月后的生命周期进行分析,Mistral与可持续发展咨询公司Carbone 4以及法国生态转型署(ADEME)展开了深度合作。此次审计严格遵循法国政府制定的“节俭AI”(Frugal AI)指南,该指南用于衡量AI的整体环境影响。Mistral表示,这项经过同行评审的研究主要关注了三个关键类别:温室气体(如二氧化碳)排放、水资源消耗以及材料消耗(主要指通过AI服务器图形处理单元GPU磨损导致的不可再生资源枯竭)。审计结果揭示,绝大部分的二氧化碳排放和水资源消耗(分别为85.5%和91%)发生在模型训练和推理阶段,而非数据中心建设或终端用户设备能耗等环节。这表明,优化AI模型本身的训练和运行效率是降低其环境影响的关键。
审计数据显示,单个平均查询(生成400个token的文本,相当于一页内容)的边际“推理时间”环境影响相对较小:仅产生1.14克二氧化碳排放和消耗45毫升水。乍看之下,这些数字似乎微不足道。然而,在模型运营的最初18个月里,结合了模型训练和数百万(乃至数十亿)次查询的累积影响,则形成了一个惊人的总量:20.4千吨二氧化碳排放和28.1万立方米的水消耗。为了更直观地理解这些数字,我们可以将20.4千吨二氧化碳排放量与美国环境保护署(EPA)的数据进行对比,它相当于约4500辆普通燃油乘用车一年运行所产生的排放量。而28.1万立方米的水消耗,则足以填满大约112个奥运会标准游泳池。这些宏观数据无疑向我们敲响了警钟:AI的规模化应用,正使其能源和资源消耗从涓涓细流汇聚成浩瀚江河。
Mistral此次审计的意义不仅在于揭示了其自身模型的环境足迹,更在于提供了一个与其他常见互联网活动进行对比的基准。例如,Mistral指出,其一次平均LLM查询产生的增量二氧化碳排放,相当于在美国观看10秒流媒体节目(或在法国观看55秒,因为法国的能源结构更清洁)的排放量。根据Mozilla基金会的数据,这也等同于进行4到27秒的Zoom视频通话所产生的排放。此外,根据Carbon Literacy的数据,花费10分钟撰写一封电子邮件并被100个收件人之一完整阅读,其碳排放量相当于22.8次Mistral查询。
这些对比数据深刻揭示了一个有趣的现象:虽然不同数字活动的社会和环境价值难以直接比较,但公众对这些活动的社会禁忌、个人负罪感以及在线抱怨的程度,与其真实环境足迹可能并不对等。当人们警告AI能源消耗可能“毁灭地球”时,我们或许也应反思日常生活中其他看似“无害”的数字行为所积累的环境影响。这并非要淡化AI的环境问题,而是呼吁更全面、更理性的环境评估视角。
行业呼唤:迈向AI环境数据透明化与标准化
Mistral公布的数据与其他旨在估算AI环境影响的研究结果大体一致。例如,加州大学河滨分校研究人员的一项研究估计,用于OpenAI GPT-3的美国平均AI数据中心,每次LLM查询消耗近17毫升水。而2024年发表在《自然》杂志上的一项研究则估计,ChatGPT每次查询(包括训练和推理时间)平均产生2.2克二氧化碳排放。
相较于这些第三方估算,Mistral直接提供数据无疑为其报告增添了额外的份量和可信度。然而,Mistral也坦诚其数据仅代表模型总环境影响的“首次近似值”,其中一些关键环节,例如GPU生命周期影响的估算,仍依赖于重要的假设。Hugging Face的AI与气候主管Sasha Luccioni也指出,Mistral发布的信息仍然缺乏重要的重要的方法论细节,以及模型总能源消耗(而非估算排放量)的具体数据。这表明,AI环境影响的全面量化仍面临复杂性。
尽管存在局限性,Luccioni仍然称赞这份报告是“AI模型环境影响评估方面迈出的重要第一步”,并希望它能激励其他AI公司效仿,提高自身环境足迹的透明度。Mistral也正积极呼吁其他模型开发商对其环境影响保持更高程度的透明度,认为这种比较性结果“可以促进建立一套评分系统,帮助买家和用户识别碳排放、水资源消耗和材料密集度最低的模型”。
这一呼吁并非空穴来风。随着AI技术的普及,其供应链、数据中心运营以及模型生命周期各环节的环境影响日益凸显。缺乏统一的衡量标准和公开数据,使得行业难以进行有效的横向比较,也难以识别和推广更环保的AI解决方案。建立一套普适的、经同行评审的环境评估框架,不仅能促进行业内部的良性竞争,鼓励创新以降低环境足迹,还能赋能消费者和企业用户做出更负责任的选择。
展望未来:构建可持续的AI生态系统
人工智能的未来发展,必须与可持续发展理念深度融合。Mistral的此次环境审计,正是推动这一融合的关键一步。它不仅提供了具体的数据支撑,更重要的是,为整个行业树立了一个透明化、负责任的典范。要构建一个真正可持续的AI生态系统,我们需要多方协同努力:
1. 技术创新与优化
AI研究者和工程师需要将环境可持续性纳入模型设计和优化之初。这包括开发更节能的算法、优化模型架构以减少计算量、探索低功耗硬件解决方案、以及采用更高效的数据处理策略。例如,剪枝、量化和知识蒸馏等模型压缩技术,可以在不显著牺牲性能的前提下大幅降低模型大小和推理能耗。联邦学习和边缘计算等分布式AI范式,也有助于减少集中式数据中心的压力,从而降低整体能源消耗。
2. 数据中心绿色化
作为AI运行的物理基础,数据中心的绿色化至关重要。这包括采用可再生能源供电、优化冷却系统以降低能耗、提高能源利用效率(PUE)、以及探索热量回收再利用的可能性。许多大型科技公司已开始投资建设零碳数据中心,但推广普及仍需政策引导和技术突破。
3. 政策制定与行业标准
政府和国际组织应积极参与制定统一的AI环境影响评估标准和报告框架,鼓励并强制AI公司披露其环境足迹。通过设立激励机制和监管要求,引导行业向更可持续的方向发展。例如,欧盟的《人工智能法案》在未来可能会纳入更多的环境考量。
4. 供应链的可持续性
AI的生命周期不仅限于模型训练和运行。从GPU的制造、原材料的开采到服务器的报废回收,整个供应链环节的环境影响同样不容忽视。AI公司应与供应商紧密合作,推动供应链的透明化和可持续化,确保生产过程符合环保标准,并探索循环经济模式,减少电子垃圾的产生。
5. 公众教育与意识提升
提升公众对AI环境影响的认识,有助于形成自下而上的推动力。消费者和企业用户应被赋予工具和信息,以便在选择AI产品和服务时,将环境因素纳入考量。当市场对“绿色AI”的需求增长时,将反向激励企业加大可持续发展投入。
Mistral的审计报告是一个起点,而非终点。它为我们提供了一面镜子,映照出AI发展中的环境挑战,同时也指明了前行的方向。唯有通过持续的技术创新、透明的数据披露、健全的政策引导和全社会的共同参与,人工智能才能真正实现其赋能人类社会的潜力,同时成为推动地球可持续发展的积极力量。这不仅是技术进步的必然选择,更是我们对未来世代的庄重承诺。