AI经济指数报告:全球人工智能应用格局与劳动力变革

1

引言:AI应用的地域差异

夏威夷的旅行规划、马萨诸塞州的科学研究,以及在印度构建网络应用程序——表面上,这三项活动似乎毫无共同之处。然而,事实证明,这些正是Claude在不同地区被过度使用的特定场景。

这并不意味着这些是最受欢迎的任务:软件工程在全球几乎所有国家和州仍然遥遥领先。相反,这意味着马萨诸塞州的人们比其他地区更有可能请求Claude协助科学研究,或者,例如,巴西的Claude用户似乎对语言学习特别热衷:他们使用Claude进行翻译和语言学习的频率是全球平均水平的六倍左右。

这些数据来自我们第三期《Anthropic经济指数报告》。在最新报告中,我们扩大了记录AI早期采用模式的努力,这些模式正开始重塑工作和经济。我们测量了Claude的使用方式如何不同……

  • **……在美国国内:**我们首次提供了各州AI使用差异的详细评估。我们发现,各州经济构成决定了哪些州人均使用Claude最多——而且,令人惊讶的是,使用率最高的州并非以编程为主导的州。
  • **……在不同国家之间:**我们的新分析发现,各国使用Claude的情况与收入密切相关,而且低使用率国家的用户比高使用率国家的用户更频繁地使用Claude来自动化工作。
  • **……随时间变化:**我们将最新数据与2024年12月至2025年1月以及2025年2月至3月的数据进行比较。我们发现,"指令式"自动化任务的比例从27%急剧上升到39%,表明AI的责任(以及用户的信任)正在迅速增加。
  • **……以及企业用户:**我们现在包括来自Anthropic第一方API客户的匿名数据(除了Claude.ai的用户),使我们能够首次分析企业的互动。我们发现,API用户比消费者更有可能使用Claude自动化任务,这表明劳动力市场可能面临重大影响。

地理差异:全球AI采用的不平等格局

全球Claude使用占比前30的国家:美国以21.6%领先

全球Claude.ai使用占比领先的国家。

美国使用Claude的频率远超其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的份额相近。

然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们根据各国占全球工作年龄人口的比例调整了它们在Claude.ai使用中的份额。这得出了我们的Anthropic AI使用指数(AUI)。AUI大于1的国家使用Claude的频率比仅根据其工作年龄人口预期的要高,反之亦然。

Anthropic AI使用指数得分最高的二十个国家:以色列、新加坡、澳大利亚、新西兰和韩国位居前五

Anthropic AI使用指数得分最高的二十个国家。

从AUI数据中,我们可以看到一些小型、技术先进的国家(如以色列和新加坡)相对于其工作年龄人口在Claude采用方面处于领先地位。这在很大程度上可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在很强的相关性(人均GDP每提高1%,AUI提高0.7%)。这是合理的:最常使用Claude的国家通常也拥有强大的互联网连接,以及以知识工作而非制造业为导向的经济。但这确实提出了经济分化的问题:先前的通用技术,如电气化或内燃机,既带来了巨大的经济增长,也导致了世界各地生活水平的巨大分化。如果AI的影响在富裕国家最大,这种通用技术可能具有类似的经济影响。

图表显示各国人均Claude使用量与人均收入呈正相关关系

各国人均Claude使用量与人均收入呈正相关关系。(坐标轴采用对数刻度)

美国国内的使用模式

在比较美国各州时,人均GDP与人均Claude使用之间的关联同样成立。事实上,在美国国内,收入增长带来的使用率增长速度比国家间更快:美国内人均GDP每提高1%,人口调整后的Claude使用率提高1.8%。也就是说,收入在美国国内实际上比国家间解释力更弱,因为整体趋势内存在更高的方差。也就是说:除了收入之外,其他因素必须解释人口调整后使用差异的更多部分。

图表显示美国各州相对于其工作年龄人口的Claude采用率,犹他和华盛顿特区领先

美国各州相对于其工作年龄人口的Claude采用率。

Claude使用趋势

自2024年12月以来,我们一直在追踪人们如何使用Claude。我们使用一种保护隐私的分类方法,将匿名对话转录分类为由ONET定义的任务组,ONET是美国政府数据库,分类职业及其相关任务。通过这样做,我们可以分析自去年以来人们给Claude的任务如何变化,以及人们选择协作的方式——他们对Claude工作的监督和输入程度——如何变化。

任务变化

自2024年12月以来,计算机和数学类别的Claude使用在我们的类别中占主导地位,约占对话的37-40%。

但情况发生了很大变化。在过去的九个月里,我们观察到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%上升到13%),与物理和社会科学相关的任务份额增加了三分之一(从6%增加到8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%下降到3%,与商业和财务运营相关的任务份额减半,从6%下降到3%。(当然,从绝对值来看,每个类别的对话数量仍然显著增加。)

Claude使用随时间的变化,显示科学和教育任务的使用增加,而艺术、商业和建筑用途的使用减少

Claude使用随时间的变化,显示科学和教育任务的使用增加。

总体趋势有些波动,但一般来说,随着国家人均GDP的增加,Claude的使用从计算机和数学职业类别的任务转向更多样化的其他活动,如教育、艺术和设计;办公室和行政支持;以及物理和社会科学。比较下图中的第一条趋势线与其他三条:

职业群体份额与Anthropic AI使用指数的关系,适用于计算机和数学、教育指导、艺术以及办公室和行政任务

随着我们从采用率较低的国家转向较高的国家,Claude的使用似乎转向了更多样化的任务组合,尽管整体模式有些波动。

尽管如此,软件开发仍然是我们追踪的每个国家最常见的用途。在美国的情况也类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。

互动模式

正如我们之前讨论的,我们通常区分涉及_自动化_(AI直接产生工作,用户输入最少)和_增强_(用户和AI协作完成任务)的任务。我们进一步将自动化分解为_指令式_和_反馈循环_互动,其中指令式对话涉及最少的人类互动,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还将增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。

自2024年12月以来,我们发现指令式对话的份额急剧上升,从27%上升到39%。其他互动模式(特别是学习、任务迭代和反馈循环)的份额因此略有下降。这意味着,自动化(49.1%)首次在总体上变得比增强(47%)更常见。一个可能的解释是,AI正在迅速赢得用户的信任,并越来越多地负责完成复杂的工作。

这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型越来越擅长预测用户需求和产生高质量工作,用户可能更愿意在首次尝试时就信任模型的输出。

从我们的第一到第三指数报告中显示的自动化超过增强的图表

自动化随时间呈增加趋势。

令人惊讶的是,人均Claude使用率较高的国家,Claude的用途倾向于增强,而低使用率国家的人则更可能偏好自动化。在控制相关任务的组合后,人口调整后的Claude使用率每增加1%,自动化率大约减少3%。同样,人口调整后的Claude使用率增加与_远离_自动化(如下图所示)相关,而不是朝向自动化。

图表显示人均Claude使用率较高的国家倾向于自动化任务的份额较低

人均Claude使用率较高的国家倾向于以更协作的方式使用Claude。

企业用户的AI应用

使用我们在Claude.ai对话中使用的相同保护隐私的方法,我们已经开始对Anthropic第一方API客户子集的互动进行抽样分析,这是首次此类分析。API客户通常是企业和开发者,他们使用Claude的方式与通过Claude.ai访问的人非常不同:他们按令牌付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。

这些客户使用Claude的情况特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(巧合的是,大约5%的所有API流量专门集中在开发和评估AI系统上。)这被与教育职业(API上为4%,而Claude.ai上为12%)以及艺术和娱乐(API上为5%,而Claude.ai上为8%)相关的较小比例对话所抵消。

我们还发现,我们的API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。我们77%的API对话显示出自动化模式,其中绝大多数是指令式的,而只有12%显示出增强模式。在Claude.ai上,比例几乎持平。这可能具有重大的经济意义:过去,任务的自动化与重大的经济转型以及生产力的巨大增长相关联。

图表显示在Claude.ai上增强性使用的份额远高于API,反之亦然对于自动化使用

在Claude.ai和API上使用Claude进行增强和自动化。

最后,鉴于API的使用方式,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异如何影响企业选择"购买"哪些任务。在这里,我们发现价格和使用之间存在_正相关_:较高成本的任务类别往往看到更频繁的使用,如下图所示。这向我们表明,基本模型能力以及模型产生的经济价值对企业来说比完成任务本身的成本更重要。

图表显示职业类别使用份额与平均API成本的关系

任务成本 plotted against 任务类别在总对话中的份额。

结论:AI经济影响的不平等与演变

经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。到目前为止,我们发现了什么?

在本报告涵盖的每个衡量指标中,AI的采用似乎极不均衡。高收入国家的人们更有可能使用Claude,更有可能寻求协作而非自动化,更有可能追求超越编码的广泛用途。在美国,AI使用似乎受到当地主导产业的影响,从技术到旅游业。而企业比消费者更可能将责任和自主权委托给Claude。

除了不平等的事实,特别值得注意的是,在Claude.ai上的对话中,指令式自动化在过去九个月中变得更加普遍。人们使用Claude的性质显然仍在被定义:我们仍在集体决定我们对AI工具有多少信心,以及我们应该给予它们多少责任。然而,到目前为止,看起来我们正变得越来越适应AI,并愿意让它代表我们工作。我们期待随着时间的推移重新分析这一情况,看看用户的选择将在哪里——或者,确实,是否——随着AI模型的改进而稳定下来。

如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上这样做,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,因此您可以继续跟踪AI对工作和经济的影响,以您感兴趣的方式。

我们的完整报告可在此处获取。我们希望它能够帮助政策制定者、经济学家和其他人更有效地为AI提供的经济机遇和风险做好准备。

开放数据与研究合作

与我们过去的报告一样,我们发布了此版本的全面数据集,包括地理数据、任务级使用模式、按任务分类的自动化/增强分解,以及API使用概述。数据可在Anthropic经济指数网站下载。

如果您有兴趣在Anthropic工作,帮助构建推动这项研究的系统,我们鼓励您申请我们的研究工程师职位。