AI经济指数报告:全球AI采用模式与劳动力市场变革

1

引言:AI经济采用的早期图景

在夏威夷规划旅行、在马萨诸塞州进行科学研究、在印度构建网络应用。表面上,这三项活动似乎几乎没有共同点。但事实上,这些正是Claude在不同地区被过度使用的特定案例。

这并不意味着这些是最受欢迎的任务:软件工程在全球几乎所有州和国家仍然遥遥领先。相反,这意味着马萨诸塞州的人们比其他地区更倾向于要求Claude帮助科学研究,例如,巴西用户似乎对语言特别热衷:他们使用Claude进行翻译和语言学习的频率大约是全球平均水平的六倍。

这些数据来自我们第三份《Anthropic经济指数报告》。在最新报告中,我们扩大了记录AI早期采用模式的工作,这些模式正在重塑工作和经济。我们测量Claude的使用方式如何在不同维度上变化:

  • ...在美国国内:我们首次提供了各州AI使用差异的详细评估。我们发现,各州经济的构成决定了哪些州人均Claude使用率最高——而且,令人惊讶的是,使用率最高的州并非那些以编程为主导的州。
  • ...在不同国家间:我们的新分析发现,国家的Claude使用情况与收入密切相关,并且在低使用率国家,人们使用Claude自动化工作的频率比高使用率国家更高。
  • ...随时间变化:我们将最新数据与2024年12月-2025年1月和2025年2月-3月的数据进行比较。我们发现,"直接"自动化任务的比例从27%急剧上升到39%,表明AI的责任(以及用户的信任)正在迅速增加。
  • ...以及企业用户:我们现在包括Anthropic第一方API客户的匿名数据(以及Claude.ai用户),使我们能够首次分析企业的互动。我们发现,API用户比消费者更有可能使用Claude自动化任务,这表明主要的劳动力市场影响可能即将到来。

地理分布:AI采用的全球图景

我们已扩展Anthropic经济指数以纳入地理数据。下面我们介绍我们关于Claude在不同国家和美国各州使用情况的发现。

国家间的差异

美国对Claude的使用远超其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的份额相近。

全球Claude使用份额前30个国家:美国以21.6%领先

全球Claude.ai使用份额领先国家。

然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们将各国Claude.ai使用份额按其占世界工作人口的份额进行调整。这给了我们Anthropic AI使用指数(AUI)。AUI大于1的国家基于其工作年龄人口使用Claude的频率高于预期,反之亦然。

Anthropic AI使用指数得分最高的20个国家:以色列、新加坡、澳大利亚、新西兰和韩国位居前五。

Anthropic AI使用指数得分最高的20个国家。

从AUI数据中,我们可以看到一些小型、技术先进的国家(如以色列和新加坡)相对于其工作年龄人口在Claude采用方面领先。这在很大程度上可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在强相关性(人均GDP每提高1%,AUI提高0.7%)。这是有道理的:最常使用Claude的国家通常也拥有强大的互联网连接,以及以知识工作而非制造业为导向的经济。但这确实提出了一个经济分歧的问题:先前的通用技术,如电气化或内燃机,带来了巨大的经济增长和全球生活水平的巨大分歧。如果AI的影响在富裕国家最大,这种通用技术可能具有类似的经济影响。

图表显示各国人均Claude使用与人均收入呈正相关。

各国人均Claude使用与人均收入呈正相关。(坐标轴为对数刻度。)

美国国内的模式

在比较美国各州时,人均GDP与人均Claude使用之间的关联也存在。事实上,在美国国内,收入的增长与使用率上升的关系比国家间更为迅速:人均GDP每提高1%,人口调整后的Claude使用率提高1.8%。也就是说,在美国国内,收入的解释力实际上比国家间更小,因为整体趋势中存在更高的方差。也就是说:除了收入之外,其他因素必须解释人口调整使用率差异的更多部分。

什么 else 可以解释这种采用差距?我们最好的猜测是这与各州经济结构的差异有关。美国最高的AUI是哥伦比亚特区(3.82),在那里,Claude最不成比例的频繁用途是编辑文档和搜索信息,以及其他与知识工作相关的任务。同样,与编程相关的任务在加利福尼亚州(整体AUI第三高的州)特别常见,与金融相关的任务在纽约州(排名第四)特别常见。1即使在人口调整后Claude使用率较低的州,如夏威夷,使用情况与经济结构密切相关:夏威夷人请求Claude协助旅游相关任务的频率是美国其他地区的两倍。我们的互动网站包含许多其他类似统计数据。

图表显示美国各州相对于其工作年龄人口的Claude采用情况,犹他和哥伦比亚特区领先。

美国各州相对于其工作年龄人口的Claude采用情况。

Claude使用趋势

自2024年12月以来,我们一直在跟踪人们如何使用Claude。我们使用一种保护隐私的分类方法,将匿名对话转录分类为ONET定义的任务组,ONET是美国政府分类工作和相关任务的数据库。2通过这样做,我们可以分析自去年以来人们给Claude的任务发生了哪些变化,以及人们选择协作的方式——他们选择对Claude的工作有多少监督和输入——也发生了哪些变化。

任务类型

自2024年12月以来,计算机和数学类别的Claude使用在我们的类别中占主导地位,约占对话的37-40%。

但情况发生了很大变化。在过去的九个月里,我们观察到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%增加到13%),与物理和社会科学相关的任务份额增加了三分之一(从6%增加到8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%降至3%,与商业和财务运营相关的任务份额减半,从6%降至3%。(当然,从绝对值来看,每个类别的对话数量仍然显著增加。)

Claude使用随时间的变化,显示科学和教育任务的使用增加,而艺术、商业和建筑用途的使用减少。

Claude使用随时间的变化,显示科学和教育任务的使用增加。

总体趋势虽然有些波动,但一般来说,随着一个国家人均GDP的增加,Claude的使用从计算机和数学职业类别的任务转移,转向更多样化的其他活动,如教育和艺术设计;办公和行政支持;以及物理和社会科学。将下图中的趋势线与后三个进行比较:

职业类别份额与Anthropic AI使用指数的关系,适用于计算机和数学、教育指导、艺术以及办公和行政任务。

随着我们从低采用国家向高采用国家转变,Claude使用似乎转向更多样化的任务组合,尽管整体模式存在波动。

尽管如此,软件开发仍然是我们在每个跟踪国家中最常见的用途。在美国的情况也类似,尽管我们的样本量限制了我们在更详细地探索任务组合如何随采用率变化的能力。

互动模式

正如我们之前讨论过的,我们通常区分涉及_自动化_(AI直接产生工作,用户输入最少)和_增强_(用户和AI协作完成任务)的任务。我们将自动化进一步分为_指令性_和_反馈循环_互动,其中指令性对话涉及最少的人为互动,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还增强分为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。

自2024年12月以来,我们发现指令性对话的比例急剧上升,从27%上升到39%。其他互动模式(特别是学习、任务迭代和反馈循环)的比例因此略有下降。这意味着自动化(49.1%)首次在整体上变得比增强(47%)更常见。一个可能的解释是AI正在迅速赢得用户的信任,并越来越负责任地完成复杂工作。

这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产生高质量工作方面变得更好,用户可能更愿意在第一次尝试时就信任模型的输出。

从我们的第一到第三次指数报告中,自动化超过增强的图表。

自动化似乎随时间增加。

也许令人惊讶的是,在人均Claude使用率较高的国家,Claude的用途倾向于增强,而低使用率国家的人们则更倾向于选择自动化。在控制相关任务组合的情况下,人口调整后的Claude使用率每增加1%,自动化减少约3%。同样,人口调整后的Claude使用率增加与自动化减少相关(如下图所示),而不是增加。

我们还不确定为什么会这样。这可能是因为每个国家的早期采用者感觉更舒适让Claude自动化任务,或者这可能归因于其他文化和经济因素。

图表显示人均Claude使用率较高的国家往往有较低比例的自动化任务。

人均Claude使用率较高的国家往往以更协作的方式使用Claude。

企业用户行为

使用我们在Claude.ai上对话使用的相同保护隐私的方法,我们开始从Anthropic第一方API客户子集中抽样互动,这是首次此类分析。3倾向于成为企业和开发者的API客户使用Claude的方式与通过Claude.ai访问的用户非常不同:他们按令牌付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。

这些客户对Claude的使用特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而在Claude.ai上这一比例为36%。(巧合的是,大约5%的所有API流量专门用于开发和评估AI系统。)这被与教育职业相关的对话比例较小(API上为4%,而Claude.ai上为12%)以及艺术和娱乐(5%相对于8%)所抵消。

我们还发现,我们的API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。我们77%的API对话显示出自动化模式,其中绝大多数是指令性的,而只有12%显示出增强模式。在Claude.ai上,比例几乎相当。这可能具有重大的经济意义:过去,任务的自动化与重大的经济转型以及生产力的重大增长相关联。

图表显示在Claude.ai上增强用途的比例远高于API,反之亦然用于自动化用途。

在Claude.ai和API上使用Claude进行增强和自动化。

最后,考虑到API的使用方式是付费的,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异是否影响企业选择"购买"哪些任务。在这里,我们发现使用与价格之间存在_正相关_:成本较高的任务类别往往使用频率更高,如下图所示。这向我们表明,基本模型能力和模型产生的经济价值对企业来说比完成任务本身的成本更重要。

图表显示职业类别使用份额与平均API成本的关系。

任务成本与任务类别占总对话的份额的关系。

经济影响与未来展望

经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。到目前为止我们发现了什么?

在本报告涵盖的每个衡量标准中,AI的采用都表现出显著的不均衡。高收入国家的人们更有可能使用Claude,更有可能寻求协作而非自动化,更有可能追求超越编程的广泛用途。在美国,AI使用似乎受到当地经济主导产业的强烈影响,从技术到旅游业。而且企业比消费者更可能信任Claude赋予其代理权和自主权。

除了不均衡这一事实外,特别值得注意的是,在过去的九个月里,指令性自动化在Claude.ai对话中变得更加常见。人们使用Claude的性质显然仍在被定义:我们仍在集体决定我们对AI工具有多少信心,以及我们应该赋予它们多少责任。然而,到目前为止,看起来我们正变得越来越适应AI,并愿意让它代表我们工作。我们期待随着时间的推移重新审视这一分析,看看用户的选择在哪里——或者,实际上,是否——随着AI模型的改进而趋于稳定。

如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上这样做,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,以便您能够继续跟踪AI对工作和经济的影响,并以您感兴趣的方式发展。

我们的完整报告可在此处获取。我们希望它能帮助政策制定者、经济学家和其他人更有效地为AI提供的经济机会和风险做好准备。

研究方法与数据开放

我们使用与过去报告相同的保护隐私的分析方法,将对话分类为ONET任务组,并辅以Claude自己的任务分类方法,以解决ONET类别中的任何空白。我们的隐私保护分析方法的完整细节可在此处获取。

API客户行为分析部分的数据涵盖了2025年8月的100万份转录样本,从构成我们大约一半1P API使用量的1P API客户池中随机抽样。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和合同协议。

与过去报告一样,我们发布了本版本的全面数据集,包括地理数据、任务级使用模式、按任务分类的自动化/增强细分,以及API使用概述。数据可在Anthropic经济指数网站下载。

结论:AI经济影响的早期证据

Anthropic经济指数报告为我们提供了理解AI如何改变全球经济的独特视角。报告揭示的几个关键发现值得政策制定者、企业和研究机构关注:

  1. AI采用的不均衡性:AI的使用与经济发展水平高度相关,高收入国家不仅使用频率更高,而且使用模式更加多样化,超越单纯的编程任务。这种不均衡可能导致新的经济分化,类似于历史上电气化和内燃机技术带来的影响。

  2. 地区经济结构的影响:在美国各州,AI使用模式与当地产业结构高度一致。这表明AI技术的采用不是均匀分布的,而是与特定地区的经济活动和产业需求紧密相连。

  3. 企业自动化趋势:企业用户通过API使用Claude时,自动化比例高达77%,远高于普通用户的49.1%。这表明企业正在更积极地探索AI的自动化潜力,可能预示着劳动力市场的重大变革。

  4. 用户信任度的快速提升:过去九个月中,直接自动化任务比例从27%跃升至39%,反映出用户对AI能力的信任正在迅速增强。这种信任度的提升与模型性能的改进密切相关。

  5. 协作vs.自动化模式差异:高收入国家倾向于使用AI进行协作(增强模式),而低收入国家则更倾向于自动化。这种差异可能反映了不同地区的技术接受度和工作文化。

这些发现为我们理解AI的经济影响提供了宝贵的早期证据。随着AI技术的不断发展和普及,持续监测这些趋势将对于制定相关政策、调整经济战略以及准备劳动力市场转型至关重要。Anthropic承诺定期更新这些数据,为全球AI经济研究提供持续的支持。