AI经济革命:Anthropic指数揭示全球人工智能应用格局

1

在夏威夷规划旅行、在马萨诸塞州进行科学研究、在印度构建网络应用程序——表面上看,这三项活动似乎毫无共同之处。然而,事实证明,这些正是Claude在不同地区被过度使用的特定场景。

这并不意味着这些是最受欢迎的任务:软件工程仍然是全球几乎所有州和国家中最领先的应用。相反,这意味着马萨诸塞州的人们比其他地区更有可能请求Claude协助科学研究,例如,巴西的Claude用户似乎对语言学习特别热衷:他们使用Claude进行翻译和语言学习的频率是全球平均水平的六倍左右。

这些是我们最新发布的第三份《Anthropic经济指数报告》中发现的统计数据。在最新报告中,我们扩大了记录AI早期采用模式的努力,这些模式正在重塑工作和经济。我们测量了Claude的使用差异在不同维度的表现:

  • 在美国境内:我们首次提供了各州AI使用差异的详细评估。我们发现各州经济结构决定了人均Claude使用量最高的州——令人惊讶的是,使用率最高的州并非以编程为主导的州。
  • 在不同国家间:我们的新分析发现,各国的Claude使用量与收入水平密切相关,且使用率较低国家的用户比使用率较高国家的用户更频繁地使用Claude来自动化工作。
  • 随时间变化:我们将最新数据与2024年12月至2025年1月以及2025年2月至3月的数据进行比较。我们发现,"指令式"自动化任务的比例从27%急剧上升到39%,表明AI的责任(和用户的信任)正在迅速增加。
  • 企业用户的使用模式:我们现在包括了Anthropic直接API客户的匿名数据(除Claude.ai用户外),使我们首次能够分析企业的交互行为。我们发现API用户比消费者更有可能使用Claude自动化任务,这可能预示着重大的劳动力市场影响。

地理差异:全球AI采用格局

我们扩展了Anthropic经济指数,纳入了地理数据。以下是我们对Claude在不同国家和美国各州使用情况的发现。

各国AI采用情况

美国的Claude使用量远超其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的使用份额相近。

全球Claude使用份额前30名国家:美国以21.6%领先

全球Claude.ai使用份额领先的国家。

然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们根据各国占全球工作年龄人口的比例调整了其Claude.ai使用份额。这得出了我们的Anthropic AI使用指数(AUI)。AUI大于1的国家表示其使用Claude的频率仅基于工作年龄人口就超出预期,反之亦然。

Anthropic AI使用指数得分最高的20个国家:以色列、新加坡、澳大利亚、新西兰和韩国位居前五

Anthropic AI使用指数得分最高的20个国家。

从AUI数据可以看出,一些小型技术先进国家(如以色列和新加坡)相对于其工作年龄人口在Claude采用方面处于领先地位。这在很大程度上可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在强烈相关性(人均GDP每提高1%,AUI提高0.7%)。这是合理的:最常使用Claude的国家通常也拥有强大的互联网连接,以及以知识工作而非制造业为导向的经济。但这确实提出了经济分化的问题:之前的通用技术,如电气化或内燃机,既带来了巨大的经济增长,也导致了全球生活水平的巨大分化。如果AI的影响在富裕国家最为显著,这种通用技术可能具有类似的经济影响。

显示各国人均Claude使用量与人均收入呈正相关关系的图表

各国人均Claude使用量与人均收入呈正相关关系。(坐标轴为对数刻度)

美国国内的AI使用模式

比较美国各州时,人均GDP与人均Claude使用量之间的关联同样存在。事实上,美国国内收入增长与使用量增长的相关性比国家间更为迅速:美国内人均GDP每提高1%,与人口调整后的Claude使用量提高1.8%相关。也就是说,收入在美国国内解释力实际上比国家间更小,因为整体趋势内的方差要高得多。也就是说:除了收入之外,其他因素必须解释人口调整后使用量差异的大部分。

还有什么可以解释这种采用差距?我们最好的猜测是这与各州经济结构的差异有关。美国最高的AUI出现在华盛顿特区(3.82),在那里,Claude被过度使用的最频繁任务是编辑文档和搜索信息,以及其他与特区知识工作相关的任务。同样,与编程相关的任务在加州(整体AUI第三高的州)特别常见,而与金融相关的任务在纽约(排名第四)特别常见。¹即使在人口调整后Claude使用量较低的州,如夏威夷,使用量也与经济结构密切相关:夏威夷人请求Claude协助旅游相关任务的频率是美国其他地区的两倍。我们的交互式网站包含许多其他类似统计数据。

显示美国各州相对于其工作年龄人口的Claude采用情况,犹他州和华盛顿特区领先

美国各州相对于其工作年龄人口的Claude采用情况。

Claude使用趋势

自2024年12月以来,我们一直在追踪人们如何使用Claude。我们使用一种保护隐私的分类方法,将匿名对话记录分类为ONET定义的任务组,ONET是美国政府数据库,用于分类工作及其相关任务。²通过这样做,我们可以分析自去年以来人们给Claude的任务如何变化,以及人们选择协作的方式——他们对Claude工作的监督和投入程度——如何变化。

任务类型变化

自2024年12月以来,计算机和数学领域的Claude使用在我们分类中占主导地位,约占对话的37-40%。

但情况发生了很大变化。在过去的九个月里,我们看到"知识密集型"领域持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%增至13%),与物理和社会科学相关的任务份额增加了三分之一(从6%增至8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%降至3%,与商业和金融运营相关的任务份额减半,从6%降至3%。(当然,从绝对值来看,每个类别的对话数量仍然显著增加。)

Claude使用随时间的变化,显示科学和教育任务使用增加,艺术、商业和建筑使用减少

Claude使用随时间的变化,显示科学和教育任务使用增加。

总体趋势虽有波动,但通常情况下,随着国家人均GDP的增加,Claude的使用逐渐远离计算机和数学职业组的任务,转向更多样化的其他活动,如教育和艺术设计;办公和行政支持;以及物理和社会科学。比较下图中的第一条趋势线与剩余三条:

职业组份额与Anthropic AI使用指数的关系,针对计算机和数学、教育指导、艺术以及办公和行政任务

随着我们从采用率较低的国家向采用率较高的国家转变,Claude的使用似乎转向更多样化的任务组合,尽管整体模式存在波动。

尽管如此,软件开发仍然是我们跟踪的每个国家最常见的用途。美国的情况也类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。

交互模式变化

正如我们之前讨论的,我们通常区分涉及自动化(AI直接产生工作,用户输入最少)和增强(用户和AI协作完成任务)的任务。我们将进一步自动化分解为指令式反馈循环交互,其中指令式对话涉及最少的人机交互,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还将增强分解为学习(请求信息或解释)、任务迭代(与Claude协作工作)和验证(请求反馈)。

自2024年12月以来,我们发现指令式对话的比例急剧上升,从27%增至39%。其他交互模式(特别是学习、任务迭代和反馈循环)的比例因此略有下降。这意味着自动化(49.1%)首次整体上比增强(47%)更常见。一个可能的解释是AI正在迅速赢得用户信任,并承担起完成复杂工作的责任。

这可能是模型能力提高的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产出高质量工作方面变得更好,用户可能更愿意在首次尝试时就信任模型的输出。

从我们的第一份到第三份指数报告中,自动化超越增强的图表

自动化随时间增长。

令人惊讶的是,在人均Claude使用量较高的国家,Claude的用途倾向于增强,而使用率较低国家的人们则更倾向于自动化。在控制相关任务的组合后,人口调整后的Claude使用量每增加1%,自动化程度大约减少3%。同样,人口调整后的Claude使用量增加与远离自动化(如下图所示)而非朝向自动化相关。

我们尚不确定原因。这可能是因为每个国家的早期采用者更愿意让Claude自动化任务,或者这可能是由于其他文化和经济因素。

显示人均Claude使用量较高的国家往往自动化任务份额较低的图表

人均Claude使用量较高的国家往往以更协作的方式使用Claude。

企业AI应用

使用我们在Claude.ai上对话相同的保护隐私方法,我们开始对Anthropic直接API客户子集的交互进行抽样分析,这是首次此类分析。³倾向于为企业开发者的API客户使用Claude的方式与通过Claude.ai访问的用户截然不同:他们按令牌付费,而非固定月度订阅,并且可以通过自己的程序发出请求。

这些客户对Claude的使用特别集中在编程和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(巧合的是,约5%的API流量专门用于开发和评估AI系统。)这被与教育职业相关的对话比例较小(API上为4%,Claude.ai上为12%)以及艺术和娱乐(API上为5%,Claude.ai上为8%)所抵消。

我们还发现,API客户使用Claude进行任务自动化比Claude.ai用户频繁得多。我们77%的API对话显示出自动化模式,其中绝大多数是指令式的,而只有12%显示出增强模式。在Claude.ai上,比例几乎持平。这可能产生重要的经济影响:过去,任务的自动化与重大的经济转型以及生产力的巨大增长相关联。

显示Claude.ai上增强用途的比例远高于API,自动化用途则相反

Claude.ai与API上的Claude增强和自动化对比。

最后,考虑到API使用如何计费,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异是否影响企业选择"购买"哪些任务。在这里,我们发现价格与使用之间存在正相关关系:较高成本的任务类别往往更频繁使用,如下图所示。这向我们表明,基本的模型能力和模型产生的经济价值对企业来说比完成任务本身的成本更为重要。

显示职业类别使用份额与平均API成本的图表

按任务类别划分的成本占总对话份额的对比图。

经济影响与未来展望

经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。迄今为止我们发现了什么?

在本报告涵盖的每个衡量指标中,AI的采用似乎极不均衡。高收入国家的人们更有可能使用Claude,更有可能寻求协作而非自动化,更有可能追求编程之外的多样化用途。在美国,AI使用似乎受到当地经济主导产业的强烈影响,从技术到旅游业。而且企业比消费者更可能将责任和自主权委托给Claude。

除了不均衡这一事实外,特别值得注意的是,在过去九个月里,指令式自动化在Claude.ai对话中变得更加普遍。人们使用Claude的性质显然仍在被定义中:我们仍在集体决定对AI工具有多大的信心,应该给予它们多少责任。然而,到目前为止,看起来我们正变得越来越适应AI,并愿意让它代表我们工作。我们期待随着时间的推移重新审视这一分析,看看随着AI模型的改进,用户的选择会在哪里——或者,确实,是否——趋于稳定。

如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上进行,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新这个网站,让您能够继续以您感兴趣的方式追踪AI对工作和经济的影响演变。

我们的完整报告在此提供。我们希望它能够帮助政策制定者、经济学家和其他人更有效地为AI带来的经济机遇和风险做好准备。

开放数据与研究机会

与之前的报告一样,我们为本次发布发布了一个全面的数据集,包括地理数据、任务级使用模式、按任务分类的自动化/增强分解以及API使用概述。数据可在Anthropic经济指数网站下载。

如果您有兴趣在Anthropic工作,帮助构建支持这项研究的系统,我们鼓励您申请我们的研究工程师职位。

¹至于犹他州,排名第二:在进一步调查犹他州的活动时,我们发现其使用量中相当一部分似乎与协调滥用的指标相关——这也反映在犹他州远高于平均水平的"指令式"自动化得分上。然而,我们进行了稳健性检查,并相信这种活动并未驱动结果。

²我们通过"自下而上"的任务分类对此进行补充,其中Claude根据自身的分类法对对话进行分类,以解决O*NET类别中的任何差距。我们保护隐私的分析方法的完整细节可在此处获取。

³本节数据涵盖2025年8月的100万份转录本,从构成我们1P API使用量约一半的1P API客户池中随机抽样。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和协议。