引言:AI使用模式的地理差异
在夏威夷规划旅行、在马萨诸塞州进行科学研究、在印度构建网络应用程序——表面上看,这三项活动似乎毫无共同之处。然而,事实证明,这些正是Claude在不同地区被过度使用的特定场景。
这并不意味着这些是最受欢迎的任务:软件工程在全球几乎所有国家和州仍然遥遥领先。相反,这意味着马萨诸塞州的人们比其他地方的人更有可能向Claude寻求科学研究的帮助——或者,例如,巴西的Claude用户似乎对语言特别热衷:他们使用Claude进行翻译和语言学习的频率大约是全球平均水平的六倍。
这些是我们第三份《Anthropic经济指数报告》中发现的统计数据。在本期报告中,我们扩展了记录AI早期采用模式的努力,这些模式开始重塑工作和经济。我们测量了Claude的使用方式如何在不同维度上发生变化...
- 在美国国内:我们首次提供了各州AI使用差异的详细评估。我们发现各州经济结构决定了哪些州人均使用Claude最多——而且,令人惊讶的是,使用率最高的州并非以编程为主导的州。
- 在不同国家之间:我们的新分析发现,各国对Claude的使用与收入密切相关,且在低使用率国家的人们比高使用率国家的人们更频繁地使用Claude来工作自动化。
- 随时间变化:我们将最新数据与2024年12月至2025年1月以及2025年2月至3月的数据进行比较。我们发现,"指令式"自动化任务的比例从27%急剧上升到39%,表明AI的责任(和用户的信任)正在迅速增加。
- 以及企业用户:我们现在包括了Anthropic第一方API客户的匿名数据(除了Claude.ai用户),使我们能够首次分析企业的交互。我们发现,API用户比消费者更有可能使用Claude自动化任务,这表明劳动力市场可能面临重大影响。
地理分布:AI采用率的全球格局
各国AI采用情况
美国对Claude的使用远超任何其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的份额相似。
全球Claude.ai使用份额领先的国家。
然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们将各国Claude.ai的使用份额按其占全球劳动人口的份额进行调整。这给我们带来了Anthropic AI使用指数(AUI)。AUI大于1的国家比仅根据其劳动年龄人口预期的使用Claude更频繁,反之亦然。
Anthropic AI使用指数得分最高的20个国家。
从AUI数据中,我们可以看到一些小型、技术先进的国家(如以色列和新加坡)相对于其劳动年龄人口在Claude采用方面处于领先地位。这在很大程度上可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在强相关性(人均GDP每提高1%,AUI提高0.7%)。这是合理的:最常使用Claude的国家通常也拥有强大的互联网连接,以及以知识工作而非制造业为导向的经济。但这确实提出了经济分化的问题:之前的通用技术,如电气化或内燃机,既带来了巨大的经济增长,也导致了全球生活水平的巨大分化。如果AI的影响在富裕国家最为显著,这种通用技术可能具有类似的经济影响。
各国人均Claude使用量与人均收入呈正相关关系。(坐标轴为对数刻度)
美国国内的AI采用模式
在比较美国各州时,人均GDP与人均Claude使用之间的联系同样成立。事实上,在美国国内,收入增长带来的使用增长比国家之间更快:美国内人均GDP每提高1%,人口调整后的Claude使用率提高1.8%。也就是说,收入在美国国内实际上比国家之间的解释力更小,因为整体趋势内的方差要高得多。也就是说:除了收入之外,其他因素必须解释人口调整后使用率的更多变化。
还有什么可以解释这种采用差距?我们最好的猜测是这与各州经济结构的差异有关。美国最高的AUI是哥伦比亚特区(3.82),在那里最不成比例频繁使用Claude的任务包括编辑文档和搜索信息,以及其他与DC知识工作相关的任务。同样,与编码相关的任务在加州(整体AUI第三高的州)特别常见,与金融相关的任务在纽约(排名第四)特别常见。1即使在人口调整后Claude使用率较低的州,如夏威夷,使用率也与经济结构密切相关:夏威夷人请求Claude协助旅游相关任务的频率是美国其他地区的两倍。我们的交互式网站包含了许多其他类似的统计数据。
美国各州相对于其劳动年龄人口的Claude采用情况。
Claude使用趋势
自2024年12月以来,我们一直在追踪人们如何使用Claude。我们使用一种隐私保护的分类方法,将匿名对话转录分类为ONET定义的任务组,ONET是美国政府分类职业和相关任务的数据库。2通过这样做,我们可以分析自去年以来人们给Claude的任务发生了哪些变化,以及人们选择协作的方式——他们选择对Claude的工作有多少监督和输入——也发生了哪些变化。
任务类型
自2024年12月以来,计算机和数学方面的Claude使用在我们的类别中占主导地位,约占对话的37-40%。
但情况发生了很大变化。在过去的九个月里,我们观察到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%上升到13%),与物理和社会科学相关的任务份额增加了三分之一(从6%上升到8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%下降到3%,与商业和金融运营相关的任务份额减半,从6%下降到3%。(当然,从绝对值来看,每个类别的对话数量仍然显著增加。)
Claude使用随时间变化的图表,显示科学和教育任务的使用增加。
总体趋势虽然有些波动,但一般来说,随着国家人均GDP的增加,Claude的使用从计算机和数学职业组的任务转向更多样化的其他活动,如教育、艺术和设计;办公和行政支持;以及物理和社会科学。将下图中的趋势线与剩余三个图进行比较:
随着我们从低采用率国家向高采用率国家转变,Claude使用似乎转向更多样化的任务组合,尽管整体模式有些波动。
尽管如此,软件开发仍然是我们跟踪的每个国家最常见的用途。在美国情况类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。
交互模式
正如我们之前讨论的,我们通常区分涉及_自动化_(AI以最少用户输入直接产生工作)和_增强_(用户和AI协作完成任务)的任务。我们将进一步自动化分解为_指令式_和_反馈循环_交互,其中指令式对话涉及最少的人类交互,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还将增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。
自2024年12月以来,我们发现指令式对话的比例急剧上升,从27%上升到39%。其他交互模式(特别是学习、任务迭代和反馈循环)的比例因此略有下降。这意味着自动化(49.1%)首次在总体上超过了增强(47%)。一个可能的解释是,AI正在迅速赢得用户的信任,并越来越多地负责完成复杂的工作。
这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产生高质量工作方面变得更好,用户可能更愿意在首次尝试时就信任模型的输出。
自动化随时间增加。
令人惊讶的是,在人均Claude使用率较高的国家,Claude的用途倾向于增强,而低使用率国家的人们则更可能偏好自动化。控制相关任务的组合后,人口调整后的Claude使用率每增加1%,自动化率大约减少3%。同样,人口调整后的Claude使用率增加与_远离_自动化(如下图所示)相关,而不是朝向自动化。
我们尚不确定为什么会出现这种情况。这可能是因为每个国家的早期采用者感觉更愿意让Claude自动化任务,或者这可能归因于其他文化和经济因素。
人均Claude使用率较高的国家往往以更协作的方式使用Claude。
企业用户行为
使用我们用于Claude.ai对话的相同隐私保护方法,我们开始从Anthropic第一方API客户子集中抽样交互,这是首次此类分析。3倾向于成为企业和开发者的API客户使用Claude的方式与通过Claude.ai访问它的用户截然不同:他们按令牌付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。
这些客户对Claude的使用特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(巧合的是,大约5%的所有API流量专门用于开发和评估AI系统。)这被教育职业(API上为4%,而Claude.ai上为12%)和艺术娱乐(5%相对于8%)的相关对话较小比例所抵消。
我们还发现,我们的API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。我们77%的API对话显示自动化模式,其中绝大多数是指令式的,而只有12%显示增强模式。在Claude.ai上,比例几乎均等。这可能具有重大的经济影响:过去,任务的自动化与重大的经济转型以及生产力的巨大增长相关联。
Claude.ai与API上的Claude增强和自动化。
最后,考虑到API的使用方式付费,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异如何影响企业选择"购买"哪些任务。在这里,我们发现价格和使用之间存在_正相关_关系:较高成本的任务类别往往使用频率更高,如下图所示。这向我们表明,基本的模型能力和模型产生的经济价值对企业和任务本身的成本更重要。
按任务类别占总对话份额绘制的每任务成本。
结论:AI采用的不平等性
经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。到目前为止,我们发现了什么?
在本报告涵盖的每个衡量标准中,AI的采用似乎极不均衡。高收入国家的人们更有可能使用Claude,更有可能寻求协作而非自动化,更有可能追求编码之外的广泛用途。在美国,AI使用似乎受到当地经济主导产业的强烈影响,从技术到旅游业。而企业比消费者更可能将责任和自主权委托给Claude。
除了不平等的事实,特别值得注意的是,在过去的九个月里,指令式自动化在Claude.ai的对话中变得更加常见。人们使用Claude的性质显然仍在被定义:我们仍在集体决定我们对AI工具有多少信心,以及我们应该给他们多少责任。然而,到目前为止,看起来我们正变得越来越习惯于AI,并愿意代表我们工作。我们期待随着时间的推移重新审视这一分析,看看用户的选择将在哪里——或者,确实,如果——随着AI模型的改进而稳定下来。
如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上进行,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,使您能够继续以您感兴趣的方式跟踪AI对工作和经济的影响。
我们的完整报告可在此处获取。我们希望它有助于政策制定者、经济学家和其他人更有效地为AI提供的经济机会和风险做好准备。
开放数据
与过去的报告一样,我们发布了此版本的全面数据集,包括地理数据、任务级使用模式、按任务分类的自动化/增强分解以及API使用概述。数据可在Anthropic经济指数网站下载。
与我们合作
如果您有兴趣在Anthropic工作,帮助构建支持这项研究的系统,我们鼓励您申请我们的研究工程师职位。
至于排名第二的犹他州,在进一步调查犹他州的活动时,我们发现其使用中相当一部分似乎与协调滥用的指标相关——这也反映在犹他州比平均水平高得多的"指令式"自动化得分上。然而,我们进行了稳健性检查,并相信这种活动并未驱动结果。
我们补充了"自下而上"的任务分类,其中Claude根据自身的分类法对对话进行分类,以解决O*NET类别中的任何差距。我们的隐私保护分析方法的完整细节可在此处获取。
本节数据涵盖2025年8月的100万份转录本,从构成我们1P API使用量大约一半的1P API客户池中随机抽样。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和协议。