引言:AI应用的地域多样性
夏威夷的旅行规划、马萨诸塞州的科学研究,以及印度的网络应用开发。表面上看,这三项活动似乎毫无共同之处。但事实证明,这些正是Claude在各自地区被过度使用的特定应用场景。
这并不意味着这些是最受欢迎的任务:软件工程在全球几乎所有国家和州仍然遥遥领先。相反,这意味着马萨诸塞州的人们比其他地区更有可能向Claude寻求科学研究方面的帮助——或者,例如,巴西的Claude用户似乎对语言学习特别热衷:他们使用Claude进行翻译和语言学习的频率是全球平均水平的六倍左右。
这些是我们最新发布的第三份Anthropic经济指数报告中发现的统计数据。在这份最新报告中,我们扩展了记录AI早期采用模式的工作,这些模式正在开始重塑工作和经济。我们测量了Claude的使用方式如何在不同维度上发生变化……
全球AI应用的地域差异
国家间的AI采用模式
美国对Claude的使用远超其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的使用份额相似。
全球Claude.ai使用份额领先的国家。
然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们根据各国占全球劳动人口的份额调整了各国对Claude.ai的使用份额。这得出了我们的Anthropic AI使用指数(AUI)。AUI大于1的国家比仅根据其劳动年龄人口预期的使用Claude更频繁,反之亦然。
Anthropic AI使用指数得分最高的20个国家。
从AUI数据可以看出,一些小型技术先进国家(如以色列和新加坡)相对于其劳动年龄人口在Claude采用方面处于领先地位。这在很大程度上可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在强烈相关性(人均GDP每提高1%,AUI提高0.7%)。这是合理的:最频繁使用Claude的国家通常也拥有强大的互联网连接,以及围绕知识工作而非制造业的经济体。但这确实提出了经济分化的问题:之前的通用技术,如电气化或内燃机,既带来了巨大的经济增长,也导致了全球生活水平的巨大分化。如果AI的影响在富裕国家最为显著,这种通用技术可能具有类似的经济影响。
各国人均Claude使用量与人均收入呈正相关。(坐标轴为对数刻度)
美国国内的采用模式
在比较美国各州时,人均GDP与人均Claude使用之间的关联同样成立。事实上,在美国内部,使用量随收入增长的速度比国家间更快:美国内人均GDP每提高1%,人口调整后的Claude使用量提高1.8%。也就是说,收入在美国内部的解释力实际上比国家间小,因为整体趋势内的方差要高得多。也就是说:除了收入之外,其他因素必须解释人口调整后使用量差异的大部分。
还有什么可以解释这种采用差距?我们最好的猜测是各州经济结构的差异。美国最高的AUI出现在哥伦比亚特区(3.82),那里最不成比例频繁使用Claude的任务包括编辑文档和搜索信息,以及其他与DC知识工作相关的任务。同样,与编码相关的任务在加利福尼亚(总体AUI第三高的州)特别常见,而与金融相关的任务在纽约(排名第四)特别常见。¹即使在人口调整后Claude使用量较低的州,如夏威夷,使用量也与经济结构密切相关:夏威夷人请求Claude协助处理旅游相关任务的频率是美国其他地区的两倍。我们的交互式网站包含许多其他类似统计数据。
美国各州相对于劳动年龄人口的Claude采用情况。
Claude使用趋势
自2024年12月以来,我们一直在追踪人们如何使用Claude。我们使用一种保护隐私的分类方法,将匿名对话记录分类到由ONET定义的任务组中,ONET是美国政府数据库,对工作和相关任务进行分类。²通过这样做,我们可以分析自去年以来人们给Claude的任务发生了哪些变化,以及人们选择协作的方式——他们对Claude的工作有多少监督和输入——也发生了哪些变化。
任务变化
自2024年12月以来,计算机和数学方面的Claude使用在我们的类别中占主导地位,约占对话的37-40%。
但变化很大。在过去九个月中,我们看到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%增加到13%),与物理和社会科学相关的任务份额增加了三分之一(从6%增加到8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%下降到3%,与商业和金融运营相关的任务份额减半,从6%下降到3%。(当然,从绝对值来看,每个类别的对话数量仍然显著增加。)
Claude使用随时间的变化,显示科学和教育任务使用增加。
总体趋势有些波动,但一般来说,随着国家人均GDP的增加,Claude的使用从计算机和数学职业组的任务转移,转向教育、艺术和设计;办公和行政支持;以及物理和社会科学等多样化的其他活动。比较下图中的第一条趋势线与其他三条:
随着我们从采用率较低的国家转向采用率较高的国家,Claude使用似乎转向了更多样化的任务组合,尽管整体模式有些波动。
尽管如此,软件开发仍然是我们追踪的每个国家最常见的用途。在美国情况类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。
互动模式
正如我们之前讨论过的,我们通常区分涉及_自动化_(AI直接生成工作,用户输入最少)和_增强_(用户和AI协作完成任务)的任务。我们将进一步分解自动化为_指令性_和_反馈循环_互动,其中指令性对话涉及最少的人类互动,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还将增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。
自2024年12月以来,我们发现指令性对话的份额急剧上升,从27%增加到39%。其他互动模式(特别是学习、任务迭代和反馈循环)的份额因此略有下降。这意味着自动化(49.1%)首次在总体上变得比增强(47%)更常见。一个可能的解释是AI正在迅速赢得用户的信任,并越来越负责任地完成复杂的工作。
这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和生成高质量工作方面变得更好,用户可能更愿意在首次尝试时信任模型的输出。
自动化随时间似乎在增加。
也许令人惊讶的是,在人均Claude使用量较高的国家,Claude的用途倾向于增强,而使用量较低国家的人们则更倾向于自动化。在控制相关任务的组合后,人口调整后的Claude使用量每增加1%,自动化减少约3%。同样,人口调整后的Claude使用量增加与_远离_自动化(如下图所示)相关,而不是朝向自动化。
我们还不确定为什么会这样。这可能是因为每个国家的早期采用者感觉更允许Claude自动化任务,或者这可能归因于其他文化和经济因素。
人均Claude使用量较高的国家往往以更协作的方式使用Claude。
企业AI应用
使用我们在Claude.ai对话中使用的相同保护隐私的方法,我们已经开始对Anthropic部分第一方API客户的互动进行抽样分析,这是首次此类分析。³倾向于成为企业和开发者的API客户使用Claude的方式与通过Claude.ai访问的人截然不同:他们按令牌付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。
这些客户对Claude的使用特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(碰巧,大约5%的所有API流量专门用于开发和评估AI系统。)这被与教育职业(API上为4%,而Claude.ai上为12%)以及艺术和娱乐(5%对8%)相关的对话比例较小所抵消。
我们还发现,我们的API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。我们77%的API对话显示自动化模式,其中绝大多数是指令性的,而只有12%显示增强模式。在Claude.ai上,比例几乎平分。这可能产生重大的经济影响:过去,任务的自动化与重大的经济转型以及生产力的重大增长相关联。
在Claude.ai上使用Claude的增强与自动化。
最后,考虑到API的使用方式,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异是否影响企业选择"购买"哪些任务。在这里,我们发现价格和使用之间存在_正相关_:较高成本的任务类别往往看到更频繁的使用,如下图所示。这向我们表明,基本的模型能力和模型产生的经济价值对企业来说比完成任务本身的成本更重要。
每任务成本与任务类别占总对话份额的关系。
结论与展望
经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。到目前为止我们发现了什么?
在本报告涵盖的每个衡量标准中,AI的采用似乎都极不均衡。高收入国家的人们更有可能使用Claude,更有可能寻求协作而非自动化,更有可能追求编码之外的广泛用途。在美国内部,AI的使用似乎受到当地经济主导产业的强烈影响,从技术到旅游业。而企业比消费者更有可能将责任和自主权委托给Claude。
除了不均衡的事实,特别值得注意的是,在过去九个月中,指令性自动化在Claude.ai对话中变得更加常见。人们使用Claude的性质显然仍在被定义:我们仍在集体决定我们对AI工具有多少信心,以及我们应该给它们多少责任。然而,到目前为止,看起来我们正在越来越习惯于AI,并愿意让它代表我们工作。我们期待随着时间的推移重新审视这一分析,看看用户的选择在AI模型改进后会在哪里——或者,确实,_是否_会稳定下来。
如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上进行,其中包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,因此您可以继续以您感兴趣的方式追踪AI对工作和经济影响的演变。
我们的完整报告在此处提供。我们希望它有助于政策制定者、经济学家和其他人更有效地为AI提供的经济机会和风险做好准备。
开放数据与研究方法
与过去的报告一样,我们为此次发布发布了一个全面的数据集,包括地理数据、任务级使用模式、按任务分解的自动化/增强情况以及API使用概览。数据可在Anthropic经济指数网站下载。
研究方法说明
本研究采用保护隐私的分类方法,将匿名对话记录分类到ONET定义的任务组中。我们使用"自下而上"的任务分类作为补充,其中Claude根据自身的分类系统对对话进行分类,以解决ONET类别中的任何差距。我们保护隐私的分析方法的完整细节可在此处获取。
数据局限性
本研究的数据来自2024年12月至2025年9月期间收集的匿名对话记录。API用户数据包括2025年8月从100万个转录本中随机抽样的样本,来自构成我们约一半1P API使用量的1P API客户池。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和协议。
政策启示
这些发现对政策制定者提出了几个关键启示:
数字鸿沟问题:AI采用的不均衡性可能加剧现有的经济不平等,需要制定针对性政策确保技术红利广泛共享。
劳动力市场准备:企业用户对自动化的偏好表明劳动力市场可能面临重大转型,需要提前规划教育和再培训项目。
技术治理:随着用户对AI信任度的提升(指令性自动化从27%增至39%),需要建立相应的监管框架确保AI应用的透明度和责任归属。
区域发展策略:各州和国家的AI采用模式与其经济结构高度相关,政策制定者应考虑将AI发展与本地经济优势相结合。
未来研究应关注AI采用如何影响不同技能水平劳动力的就业前景,以及如何设计政策确保AI发展带来的经济收益能够更公平地分配。