AI环境影响几何?Mistral环境审计揭示行业可持续发展挑战

1

AI 发展对环境的影响:Mistral 的环境审计报告解读

随着人工智能技术的飞速发展,其对环境的影响日益受到关注。法国人工智能公司 Mistral 近期发布了一份名为“环境审计”的报告,旨在量化大型语言模型(LLM)对环境的具体影响。该报告一经发布,便引发了业界对于 AI 技术可持续性的广泛讨论。报告结果显示,尽管单次 AI 查询对环境的直接影响相对较小,但考虑到每年数十亿次的查询量,其累积效应不容忽视。本文将对 Mistral 的这份报告进行深入解读,并探讨 AI 行业如何朝着更加环保可持续的方向发展。

AI 真的在“摧毁”地球吗?

Mistral 公司与可持续发展咨询机构 Carbone 4 以及法国生态转型署合作,对其“Large 2”模型在近 18 个月运行周期内的生命周期进行了分析。该研究遵循法国政府的“节俭 AI 指南”,主要关注三个方面:温室气体排放、水资源消耗和材料消耗。研究发现,温室气体排放和水资源消耗主要集中在模型训练和推理阶段,分别占比 85.5% 和 91%。数据中心建设和终端用户设备所产生的环境影响相对较小。

具体而言,Mistral 的审计报告指出,生成约一页纸内容的单个平均提示(400 个 tokens)所产生的边际环境影响相对较低,约为 1.14 克二氧化碳排放和 45 毫升水消耗。然而,在过去的 18 个月中,模型训练和数百万甚至数十亿次提示的运行,导致了显著的累积效应:总计 20.4 千吨二氧化碳排放,相当于 4500 辆普通内燃机汽车一年的排放量;以及 28.1 万立方米的水蒸发,足以填满约 112 个奥运会标准游泳池。

Mistral LLM 查询的环境影响

为了更好地理解这些数字,我们可以将 Mistral 模型的环境影响与其他常见的互联网活动进行比较。例如,Mistral 指出,一次平均 LLM 查询所产生的二氧化碳排放量,相当于在美国观看 10 秒流媒体视频,或者在法国观看 55 秒(法国能源结构更清洁)。根据 Mozilla 基金会的数据,这与进行 4 到 27 秒的 Zoom 会议相当。此外,根据 Carbon Literacy 的数据,发送一封被 100 位收件人完整阅读的电子邮件 10 分钟所产生的二氧化碳排放量,相当于 22.8 次 Mistral 提示。

当然,直接比较这些活动的社会和环境“价值”并非易事,很大程度上取决于我们对 AI 工具输出价值的评估。然而,人们对于这些不同任务的社会禁忌、个人负罪感和整体网络抱怨程度,可能与其相似的环境足迹并不一致。因此,下次听到有人警告说 AI 能源消耗正在“摧毁”地球时,我们有必要对此进行更深入的思考。

呼吁更多数据公开

Mistral 公布的数据与其他评估 AI 环境影响的研究结果基本一致。例如,加州大学河滨分校的一项研究估计,美国用于 OpenAI 的 GPT-3 模型的平均 AI 数据中心,每次 LLM 提示消耗近 17 毫升水。2024 年发表在《自然》杂志上的一项研究估计,ChatGPT 每次查询的平均二氧化碳排放量为 2.2 克(包括训练和推理时间)。

与之前的第三方估计相比,Mistral 直接提供信息无疑增加了这份最新研究报告的可信度。然而,Mistral 也表示,其数据仅代表对模型总环境影响的“初步估算”,其中 GPU 生命周期影响等关键数据仍依赖于估算。Hugging Face AI & Climate 负责人 Sasha Luccioni 也指出,Mistral 发布的信息缺乏重要的方法论细节以及关于模型总能耗的信息(而非基于能耗估算的排放量)。

尽管如此,Luccioni 仍称这份报告是“在 AI 模型环境影响评估方面迈出的重要一步”,并希望其他 AI 公司能够效仿。Mistral 也呼吁其他模型制造商提高环境影响方面的透明度,认为这些比较结果“有助于创建评分系统,帮助买家和用户识别碳、水和材料密集度最低的模型”。

AI 碳足迹:解析 Mistral 环境审计报告的关键发现

Mistral 公司最近发布了一份关于其大型语言模型(LLM)环境影响的综合报告,引起了 AI 社区的广泛关注。该报告详细分析了 AI 模型的碳足迹,并为行业提供了一个重要的参考框架,以评估和减少其对环境的影响。以下是对该报告关键发现的详细解析:

1. 生命周期评估(LCA)方法:

Mistral 采用了生命周期评估(LCA)方法,该方法是一种评估产品或服务从“摇篮到坟墓”全过程环境影响的综合方法。在 AI 模型的背景下,LCA 涵盖了从数据收集和模型训练,到模型部署和推理的各个阶段。通过 LCA,Mistral 能够全面了解其 LLM 在整个生命周期中的环境足迹。

2. 三个关键环境指标:

该报告重点关注三个关键环境指标:

  • **温室气体排放:**主要以二氧化碳当量(CO2e)衡量,反映了 AI 模型在生命周期中产生的各种温室气体的总排放量。
  • **水资源消耗:**衡量 AI 模型在训练和推理过程中消耗的水资源量,尤其是在数据中心冷却方面。
  • **材料消耗:**评估 AI 模型对非可再生资源的需求,包括用于制造服务器硬件的金属和矿物。

3. 训练与推理阶段的环境影响:

报告指出,AI 模型的环境影响主要集中在训练和推理阶段。训练阶段需要大量的计算资源和能源,导致大量的温室气体排放和水资源消耗。推理阶段虽然单次查询的影响较小,但由于查询量巨大,其累积效应也不容忽视。

4. 单次查询的边际影响:

Mistral 的研究表明,生成 400 个 tokens(约一页纸内容)的单次平均查询产生的边际环境影响相对较低,约为 1.14 克 CO2e 排放和 45 毫升水消耗。然而,重要的是要认识到,这些数字是平均值,实际影响可能因模型大小、硬件效率和能源结构等因素而异。

5. 累积环境影响:

尽管单次查询的影响较小,但 AI 模型的累积环境影响却十分显著。Mistral 估计,其 “Large 2” 模型在 18 个月内产生了 20.4 千吨 CO2e 排放和 28.1 万立方米的水蒸发。这些数字强调了 AI 行业采取措施减少其环境足迹的迫切性。

6. 与其他互联网活动的比较:

为了更好地理解 AI 模型的环境影响,Mistral 将其与常见的互联网活动进行了比较。例如,一次平均 LLM 查询的 CO2e 排放量相当于在美国观看 10 秒流媒体视频。虽然这种比较有助于将 AI 的环境影响置于更广阔的背景下,但重要的是要考虑不同活动的社会和经济价值。

迈向可持续 AI 的未来:行业行动的必要性

Mistral 的环境审计报告为 AI 行业敲响了警钟,提醒我们 AI 技术的快速发展伴随着潜在的环境风险。为了确保 AI 的可持续发展,行业需要采取以下行动:

1. 提高透明度:

Mistral 呼吁其他 AI 模型制造商提高环境影响方面的透明度。通过公开数据和方法论,行业可以建立一个更清晰的 AI 环境足迹图景,并促进最佳实践的分享。

2. 采用更高效的硬件和算法:

开发更高效的硬件和算法是减少 AI 环境影响的关键。例如,使用专门的 AI 加速器(如 GPU 和 TPU)可以显著提高计算效率,从而减少能源消耗。

3. 优化数据中心能源结构:

数据中心是 AI 模型训练和推理的主要能源消耗者。通过采用可再生能源(如太阳能和风能)并提高能源效率,数据中心可以显著减少其碳足迹。

4. 探索联邦学习和边缘计算:

联邦学习和边缘计算等新兴技术可以减少 AI 模型对集中式数据中心的依赖。联邦学习允许多个参与者在不共享原始数据的情况下协作训练模型,而边缘计算则将计算任务推向设备端,从而减少数据传输和能源消耗。

5. 建立环境影响评估标准:

行业需要建立统一的环境影响评估标准,以便对不同的 AI 模型进行比较。这些标准应涵盖温室气体排放、水资源消耗、材料消耗等关键指标。

6. 鼓励可持续 AI 的创新:

政府、企业和研究机构应共同努力,鼓励可持续 AI 的创新。例如,可以资助研发更环保的 AI 算法和硬件,并推广可持续 AI 的最佳实践。

结论:

Mistral 的环境审计报告为我们提供了一个宝贵的视角,让我们得以了解 AI 技术对环境的潜在影响。通过提高透明度、采用更高效的硬件和算法、优化数据中心能源结构以及探索新兴技术,我们可以共同努力,确保 AI 的可持续发展,并最大限度地发挥其为社会带来的益处。