Anthropic经济指数:AI在全球经济中的差异化 adoption 模式

1

引言

夏威夷的旅行规划、马萨诸塞州的科学研究,以及印度的网络应用开发。表面上,这三项活动几乎没有共同点。但事实证明,这些正是Claude在这些地方被过度使用的特定场景。

这并不意味着这些是最受欢迎的任务:软件工程仍然是全球几乎所有州和国家中最领先的使用方式。相反,这意味着马萨诸塞州的人们比其他地方的人更有可能请求Claude帮助进行科学研究——例如,巴西的Claude用户似乎对语言特别热衷:他们使用Claude进行翻译和语言学习的频率是全球平均水平的六倍左右。

这些是我们第三份《Anthropic经济指数报告》中发现的统计数据。在这最新一期中,我们扩展了记录AI早期采用模式的工作,这些模式开始重塑工作和经济。我们测量了Claude的使用方式如何不同……

  • 在美国境内:我们首次提供了各州AI使用差异的详细评估。我们发现各州经济的构成决定了哪些州人均使用Claude最多——而且,令人惊讶的是,使用率最高的州并非以编程为主导的州。
  • 在不同国家之间:我们的新分析发现,各国的Claude使用与收入密切相关,而且使用率较低国家的用户比使用率较高国家的用户更频繁地使用Claude来自动化工作。
  • 随时间变化:我们将最新数据与2024年12月至2025年1月以及2025年2月至3月的数据进行比较。我们发现,"指令式"自动化任务的比例从27%急剧上升到39%,表明AI的责任(以及用户的信任度)迅速增加。
  • 以及企业用户:我们现在包括了Anthropic第一方API客户的匿名数据(除了Claude.ai用户),使我们能够首次分析企业的互动。我们发现API用户比消费者更有可能使用Claude自动化任务,这表明劳动力市场可能面临重大影响。

地理差异:AI使用的全球图景

全球Claude使用份额排名前30的国家:美国以21.6%领先

全球Claude.ai使用份额领先国家。

我们将Anthropic经济指数扩展到包含地理数据。下面我们介绍关于Claude在不同国家和美国各州使用情况的发现。

国家间的使用差异

美国对Claude的使用远超其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的份额相似。

然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们根据各国占全球劳动年龄人口的比例调整了其Claude.ai使用份额。这得出了我们的Anthropic AI使用指数(AUI)。AUI大于1的国家比仅根据劳动年龄人口预期的Claude使用更频繁,反之亦然。

Anthropic AI使用指数得分最高的20个国家:以色列、新加坡、澳大利亚、新西兰和韩国位居前五

Anthropic AI使用指数得分最高的20个国家。

从AUI数据中,我们可以看到一些小型、技术先进的国家(如以色列和新加坡)相对于其劳动年龄人口在Claude采用方面处于领先地位。这在很大程度上可能可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在很强的相关性(人均GDP每提高1%,AUI提高0.7%)。这是合理的:最常使用Claude的国家通常也拥有强大的互联网连接,以及以知识工作而非制造业为导向的经济。但这确实提出了经济分化的问题:先前的通用技术,如电气化或内燃机,既带来了巨大的经济增长,也导致了全球生活水平的巨大分化。如果AI的影响在富裕国家最大,这种通用技术可能具有类似的经济影响。

显示各国人均Claude使用与人均收入呈正相关关系的图表

各国人均Claude使用与人均收入呈正相关关系。(坐标轴为对数刻度。)

美国境内的使用模式

在比较美国各州时,人均GDP与人均Claude使用之间的联系同样成立。事实上,在美国内部,收入增长带来的使用增长速度比国家间更快:人均GDP每提高1%,人口调整后的Claude使用提高1.8%。也就是说,在美国内部,收入的解释力实际上比国家间小,因为整体趋势内的方差要高得多。也就是说:除了收入之外,其他因素必须解释人口调整后使用差异的更多部分。

还有什么可以解释这种采用差距?我们最好的猜测是这与各州经济结构的差异有关。美国最高的AUI出现在哥伦比亚特区(3.82),在那里,Claude最不成比例的频繁用途是编辑文档和搜索信息,以及其他与DC知识工作相关的任务。同样,与编码相关的任务在加利福尼亚州(总体AUI第三高的州)特别常见,而与金融相关的任务在纽约州(排名第四)特别常见。¹即使在人口调整后Claude使用率较低的州,如夏威夷,使用率也与经济结构密切相关:夏威夷人请求Claude协助处理旅游相关任务的频率是美国其他地区的两倍。我们的互动网站包含许多其他类似统计数据。

显示美国各州Claude采用相对于其劳动年龄人口的图表,犹他州和哥伦比亚特区领先

美国各州Claude采用相对于其劳动年龄人口的情况。

Claude使用的趋势

自2024年12月以来,我们一直在追踪人们如何使用Claude。我们使用一种保护隐私的分类方法,将匿名对话转录内容分类到由ONET定义的任务组中,ONET是一个美国政府数据库,用于分类工作和相关任务。²通过这样做,我们可以分析自去年以来人们给Claude的任务发生了哪些变化,以及人们选择协作的方式——他们选择对Claude的工作有多少监督和投入——也发生了哪些变化。

任务变化

自2024年12月以来,计算机和数学领域的Claude使用在我们的类别中占主导地位,约占对话的37-40%。

但很多事情已经改变。在过去的九个月里,我们观察到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%上升到13%),与物理和社会科学相关的任务份额增加了三分之一(从6%上升到8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%下降到3%,与商业和金融运营相关的任务份额减半,从6%下降到3%。(当然,从绝对数量来看,每个类别的对话数量仍然显著增加。)

Claude使用随时间变化的图表,显示科学和教育任务的使用增加,而艺术、商业和建筑用途的使用减少

Claude使用随时间变化的图表,显示科学和教育任务的使用增加。

总体趋势虽然有些波动,但通常情况下,随着国家人均GDP的增加,Claude的使用从"计算机和数学"职业组的任务转向多样化的其他活动,如教育和艺术与设计;办公室和行政支持;以及物理和社会科学。将下图中的趋势线与剩余三个图进行比较:

职业组份额与Anthropic AI使用指数的关系,针对计算机和数学、教育指导、艺术以及办公室和行政任务

随着我们从采用率较低的国家转向采用率较高的国家,Claude使用似乎转向更多样化的任务组合,尽管整体模式有些波动。

尽管如此,软件开发仍然是我们追踪的每个国家最常见的用途。在美国的情况也类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。

互动模式

正如我们之前讨论的,我们通常区分涉及_自动化_(AI直接产生工作,用户输入最少)和_增强_(用户和AI协作完成任务)的任务。我们将进一步自动化分解为_指令式_和_反馈循环_互动,其中指令式对话涉及最少的人类互动,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还进一步将增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。

自2024年12月以来,我们发现指令式对话的比例急剧上升,从27%上升到39%。其他互动模式(特别是学习、任务迭代和反馈循环)的比例因此略有下降。这意味着,自动化(49.1%)首次在总体上变得比增强(47%)更常见。一个可能的解释是,AI正在迅速赢得用户的信任,并越来越多地负责完成复杂的工作。

这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产生高质量工作方面变得更好,用户可能更愿意在第一次尝试时就信任模型的输出。

从我们的第一到第三次指数报告中显示自动化超过增强的图表

自动化随时间增加。

令人惊讶的是,在人均Claude使用率较高的国家,Claude的用途倾向于增强,而使用率较低国家的人们则更倾向于自动化。在控制相关任务组合的情况下,人口调整后的Claude使用每增加1%,自动化减少约3%。同样,人口调整后的Claude使用增加与自动化减少(如下图所示)相关,而不是增加。

我们尚不确定为什么会出现这种情况。这可能是因为每个国家的早期采用者更愿意让Claude自动化任务,或者可能是由于其他文化和经济因素。

显示人均Claude使用率较高的国家往往有较低比例的自动化任务的图表

人均Claude使用率较高的国家往往以更协作的方式使用Claude。

企业用户的AI采用模式

使用我们在Claude.ai对话中使用的相同保护隐私的方法,我们开始从Anthropic第一方API客户子集中抽样互动,这是首次此类分析。³倾向于成为企业和开发者的API客户与通过Claude.ai访问Claude的用户使用方式非常不同:他们按令牌付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。

这些客户对Claude的使用特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(巧合的是,大约5%的所有API流量专门用于开发和评估AI系统。)这与教育职业相关的对话比例较小(API上为4%,Claude.ai上为12%)以及艺术和娱乐(5%对比8%)形成对比。

我们还发现,API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。77%的API对话显示出自动化模式,其中绝大多数是指令式的,而只有12%显示出增强模式。在Claude.ai上,比例几乎相等。这可能具有重大的经济影响:过去,任务的自动化与重大的经济转型以及生产力的巨大增长相关联。

显示[Claude.ai](http://claude.ai)上增强用途的比例远高于API,反之亦然用于自动化用途的图表

Claude.ai上使用Claude的增强与自动化。

最后,考虑到API的使用方式付费,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异是否影响企业选择"购买"哪些任务。在这里,我们发现价格和使用之间存在_正相关_关系:成本较高的任务类别往往使用频率更高,如下图所示。这向我们表明,对基本模型能力和模型产生的经济价值,对企业来说比完成任务本身更重要。

显示职业类别使用份额与平均API成本的图表

按任务类别占总对话份额绘制的每任务成本。

经济分化:AI采用的不平等现象

我们的研究发现揭示了一个关键问题:AI技术的采用可能正在加剧全球经济分化。数据显示,高收入国家不仅更频繁地使用AI工具,而且更倾向于将AI作为协作伙伴而非自动化工具。这种差异可能意味着AI技术带来的经济收益将不成比例地流向已经富裕的国家和地区。

历史上,通用技术如电气化和内燃机的普及确实促进了全球经济增长,但也导致了国家间发展水平的巨大差距。如果AI技术的影响主要局限于高收入国家,我们可能正在见证一个新的经济分化时代的开始。这种分化不仅体现在国家之间,也可能在国家内部不同地区和不同社会群体之间显现。

值得注意的是,美国各州的数据显示,AI采用与当地经济结构高度相关。哥伦比亚特区、加利福尼亚州和纽约州作为各自经济领域的领导者,在AI采用方面也处于领先地位。这表明,AI技术的扩散可能进一步强化现有的经济地理格局,而非创造新的均衡发展机会。

信任与责任的演变:AI互动模式的变化

过去九个月中,Claude用户互动模式发生了显著变化,特别是指令式自动化比例的急剧上升。这一现象反映了用户对AI工具信任度的提升,以及愿意赋予AI更多自主权的趋势。从用户与AI的关系角度看,这种变化标志着人机协作进入了一个新阶段。

指令式自动化比例从27%上升到39%,表明越来越多的用户开始接受AI能够独立完成复杂任务。这种转变可能源于多方面因素:首先是模型能力的提升,使得AI能够更准确地理解用户意图并产生高质量输出;其次是用户对AI工具的熟悉度增加,减少了监督和干预的需求;最后可能是工作流程的重构,使得AI能够更深入地集成到日常工作中。

然而,这种转变也带来了新的问题和挑战。随着AI承担更多责任,如何确保其输出质量、如何界定AI决策的责任边界、如何处理AI可能产生的错误或偏见,都成为需要解决的紧迫问题。企业和政策制定者需要建立相应的框架和机制,以平衡效率提升与风险控制之间的关系。

企业与消费者:AI应用的分化

API客户与普通用户在AI使用方式上的差异揭示了AI应用领域的潜在分化。企业用户明显更倾向于将AI作为自动化工具,而普通用户则更多地将AI视为协作伙伴。这种差异不仅反映了使用场景的不同,也可能预示着AI技术对劳动力市场的影响将首先体现在企业层面。

企业用户的高自动化倾向(77%的API对话显示出自动化模式)与普通用户的相对平衡(几乎50/50的自动化与增强比例)形成鲜明对比。这一差异可能源于多方面因素:企业通常有更明确的任务流程和效率目标,而普通用户则可能更注重学习和探索;企业用户往往具备更高的技术素养,能够更好地集成AI到现有工作流程中;此外,企业使用AI通常与成本效益直接相关,而普通用户则可能更注重体验和个性化。

这种分化可能对劳动力市场产生深远影响。随着企业越来越多地采用AI自动化任务,相关岗位的工作内容和技能要求可能发生显著变化。那些能够与AI有效协作、专注于AI难以替代的创造性、战略性和人际互动方面的工作,可能会变得更加重要;而那些高度可被自动化的任务,则可能面临更大的替代压力。

未来展望:AI经济影响的演进

Anthropic经济指数的持续追踪为我们提供了一个观察AI技术经济影响的独特窗口。从目前的数据来看,AI技术的经济影响仍在形成阶段,呈现出明显的动态特征。随着技术的进一步发展和用户行为的演变,这些影响可能会呈现出新的模式和趋势。

首先,AI技术的经济影响可能从当前的效率提升和成本节约,逐渐转向创造新的商业模式和价值链。目前,AI主要被用于优化现有工作流程和提高生产力,但未来可能会催生全新的行业和职业类别,就像互联网技术在过去几十年中所做的那样。

其次,AI技术的经济影响可能从当前的局部应用,逐渐扩展到更广泛的经济领域。目前,AI的应用主要集中在技术、教育、科研等特定领域,但随着技术的成熟和普及,其影响可能会渗透到传统上被认为难以自动化的行业和领域。

最后,AI技术的经济影响可能从当前的发达国家主导,逐渐向全球扩散。虽然目前高收入国家在AI采用方面处于领先地位,但随着技术成本的下降和普及度的提高,发展中国家可能会迎头赶上,从而改变全球AI经济格局。

结论与建议

Anthropic经济指数旨在提供关于AI如何影响人们工作和经济的早期实证评估。到目前为止,我们发现了什么?

在本报告涵盖的每个衡量指标中,AI的采用似乎都极不均衡。高收入国家的人们更可能使用Claude,更可能寻求协作而非自动化,更可能追求编码以外的广泛用途。在美国,AI使用似乎受到当地经济中主导产业的强烈影响,从技术到旅游业。而企业比消费者更可能信任Claude并赋予其自主权。

除了不均衡的事实,特别值得注意的是,在过去九个月中,指令式自动化在Claude.ai对话中变得更加常见。人们使用Claude的本质显然仍在被定义:我们仍在集体决定对AI工具有多大的信心,应该给予它们多少责任。然而,到目前为止,看起来我们正变得越来越适应AI,并愿意让它代表我们工作。我们期待随着时间的推移重新审视这一分析,看看用户的选择将如何——或者,实际上,是否——随着AI模型的改进而稳定下来。

如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上进行,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,使您能够继续跟踪AI对工作和经济的影响,以您感兴趣的方式。

我们的完整报告可在此处获取。我们希望它能够帮助政策制定者、经济学家和其他人更有效地为AI带来的经济机遇和风险做好准备。

开放数据与研究机会

与我们的过去报告一样,我们正在发布此版本的全面数据集,包括地理数据、任务级使用模式、按任务分类的自动化/增强分解以及API使用概览。数据可在Anthropic经济指数网站下载。

对于研究人员、政策制定者和企业决策者来说,这些开放数据提供了探索AI经济影响的新机会。通过分析这些数据,可以更好地理解AI技术在不同地区、行业和人群中的差异化影响,从而制定更有针对性的政策和策略。

特别值得关注的是,随着数据集的持续更新,研究者可以追踪AI技术经济影响的长期演变趋势,识别关键转折点,并预测未来的发展方向。这种基于实证的研究对于理解AI技术的社会经济影响至关重要,也有助于确保AI技术的发展方向与人类社会的整体利益保持一致。