AI经济指数报告:全球AI应用格局与经济影响深度解析

1

引言:全球AI应用的差异化图景

夏威夷的旅行规划、马萨诸塞州的科学研究,以及印度的网络应用开发——表面上,这三项活动似乎毫无共同之处。然而,事实证明,这些正是Claude在不同地区被过度使用的特定场景。

这并不意味着这些是最受欢迎的任务:软件工程仍然是全球几乎所有州和国家的领先应用。相反,这意味着马萨诸塞州的人们比其他地区更倾向于使用Claude协助科学研究,例如,巴西的用户似乎对语言学习特别热衷:他们使用Claude进行翻译和语言学习的频率是全球平均水平的六倍。

这些数据来自Anthropic发布的第三季度《AI经济指数报告》。在本期报告中,我们扩展了工作范围,记录了开始重塑工作和经济的早期AI采用模式。我们测量了Claude的使用差异...

  • 在美国国内:我们首次提供了各州AI使用差异的详细评估。我们发现,各州经济结构 informs 哪些州人均使用Claude最多——而且,令人惊讶的是,使用率最高的州并非以编程为主导的州。
  • 在不同国家间:我们的新分析发现,各国对Claude的使用与收入水平密切相关,且较低使用率国家的用户比高使用率国家更频繁地使用Claude自动化工作。
  • 随时间变化:我们将最新数据与2024年12月至2025年1月以及2025年2月至3月的数据进行比较。我们发现,"指令性"自动化任务的比例从27%跃升至39%,表明AI的责任(以及用户的信任)正在迅速增加。
  • 企业用户使用情况:我们现在包括了Anthropic第一方API客户的匿名数据(除了Claude.ai的用户),使我们首次能够分析企业的交互情况。我们发现,API用户比消费者更频繁地使用Claude自动化任务,这表明劳动力市场可能面临重大影响。

地理差异:AI应用的全球格局

我们将AI经济指数扩展纳入了地理数据。下面我们概述了关于Claude在不同国家和美国各州使用情况的研究发现。

各国AI使用情况

美国对Claude的使用远超其他国家。印度位居第二,其次是巴西、日本和韩国,这些国家的份额相近。

全球Claude使用份额前30名国家:美国以21.6%领先

全球Claude.ai使用份额领先国家。

然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们根据各国占全球劳动年龄人口的份额调整了其对Claude.ai的使用份额。这得出了我们的Anthropic AI使用指数(AUI)。AUI大于1的国家基于其劳动年龄人口使用Claude的频率高于预期,反之亦然。

Anthropic AI使用指数得分最高的20个国家:以色列、新加坡、澳大利亚、新西兰和韩国位居前五

Anthropic AI使用指数得分最高的20个国家。

从AUI数据可以看出,一些小型技术先进国家(如以色列和新加坡)相对于其劳动年龄人口在Claude采用方面处于领先地位。这在很大程度上可以用收入来解释:我们发现人均GDP与Anthropic AI使用指数之间存在强相关性(人均GDP每提高1%,AUI提高0.7%)。这是合理的:最频繁使用Claude的国家通常也拥有强大的互联网连接,以及以知识工作而非制造业为导向的经济体。但这确实提出了经济分歧的问题:之前的通用技术,如电气化或内燃机,既带来了巨大的经济增长,也导致了全球生活水平的巨大分歧。如果AI的影响在富裕国家最为显著,这种通用技术可能具有类似的经济影响。

显示各国人均Claude使用与人均收入呈正相关关系的图表

各国人均Claude使用与人均收入呈正相关关系。(坐标轴为对数刻度)

美国国内的使用模式

比较美国各州时,人均GDP与人均Claude使用之间的关联同样存在。事实上,在美国国内,收入增长带来的使用增长速度比国家间更快:人均GDP每提高1%,人口调整后的Claude使用提高1.8%。也就是说,收入在美国国内的解释力实际上比国家间更小,因为整体趋势内的方差要高得多。也就是说:除了收入之外,其他因素必须解释人口调整后使用差异的大部分。

什么 else 可以解释这种采用差距?我们的最佳猜测是这与各州经济结构的差异有关。美国最高的AUI是哥伦比亚特区(3.82),在那里,Claude最不成比例的频繁用途包括编辑文档和搜索信息,以及其他与华盛顿特区知识工作相关的任务。同样,与编程相关的任务在加利福尼亚(总体AUI第三高的州)特别常见,而与金融相关的任务在纽约(排名第四)特别常见。1即使在人口调整后Claude使用率较低的州,如夏威夷,使用情况与经济结构也密切相关:夏威夷人请求Claude协助旅游相关任务的频率是美国其他地区的两倍。我们的互动网站包含许多其他类似统计数据。

显示美国各州相对于其劳动年龄人口的Claude采用情况,犹他和哥伦比亚特区领先

美国各州相对于其劳动年龄人口的Claude采用情况。

Claude使用趋势

自2024年12月以来,我们一直在跟踪人们如何使用Claude。我们使用一种保护隐私的分类方法,将匿名对话转录内容分类为ONET定义的任务组,ONET是美国政府数据库,分类职业及其相关任务。2通过这样做,我们既可以分析自去年以来人们给Claude的任务如何变化,也可以分析人们选择协作方式的变化——他们选择对Claude的工作有多少监督和投入。

任务分类

自2024年12月以来,在所有类别中,计算机和数学领域的Claude使用占主导地位,约占对话的37-40%。

但情况发生了很大变化。在过去九个月中,我们观察到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%上升到13%),与物理和社会科学相关的任务份额增加了三分之一(从6%上升到8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从所有对话的5%降至3%,与商业和金融运营相关的任务份额减半,从6%降至3%。(当然,从绝对值来看,每个类别的对话数量仍显著增加。)

Claude使用随时间的变化,显示科学和教育任务使用增加,而艺术、商业和建筑使用减少

Claude使用随时间的变化,显示科学和教育任务使用增加。

总体趋势有些波动,但一般来说,随着国家人均GDP的增加,Claude的使用从计算机和数学职业组的任务转向更多样化的其他活动,如教育和艺术设计;办公和行政支持;以及物理和社会科学。比较下图中的第一条趋势线与其他三条:

职业组份额与Anthropic AI使用指数的关系,涉及计算机和数学、教育指导、艺术以及办公和行政任务

随着我们从低采用率国家向高采用率国家转变,Claude使用似乎转向更多样化的任务组合,尽管整体模式有些波动。

尽管如此,软件开发仍然是我们在每个跟踪国家中最常见的用途。在美国的情况也类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。

交互模式

正如我们之前讨论的,我们通常区分涉及_自动化_(AI以最少用户输入直接产生工作)和_增强_(用户和AI协作完成任务)的任务。我们进一步将自动化分解为_指令性_和_反馈循环_交互,其中指令性对话涉及最少的人机交互,在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。

自2024年12月以来,我们发现指令性对话的份额急剧上升,从27%增至39%。其他交互模式(特别是学习、任务迭代和反馈循环)的份额因此略有下降。这意味着自动化(49.1%)首次在总体上变得比增强(47%)更常见。一个可能的解释是AI正在迅速赢得用户信任,并越来越多地负责完成复杂工作。

这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产出高质量工作方面变得更好,用户可能更愿意在首次尝试时就信任模型的输出。

从我们的第一到第三次指数报告显示的自动化超过增强的图表

自动化随时间似乎在增加。

令人惊讶的是,人均Claude使用率较高的国家,Claude的用途倾向于增强,而较低使用率国家的人们则更倾向于选择自动化。在控制相关任务组合的情况下,人口调整后的Claude使用每增加1%,自动化率大约减少3%。同样,人口调整后的Claude使用增加与自动化率下降(如下图所示)相关,而非上升。

我们尚不确定原因。这可能是因为每个国家的早期采用者更愿意让Claude自动化任务,或者这可能归因于其他文化和经济因素。

显示人均Claude使用率较高的国家往往自动化任务份额较低

人均Claude使用率较高的国家往往以更协作的方式使用Claude。

企业AI应用

使用我们在Claude.ai上对话相同的保护隐私方法,我们开始对Anthropic第一方API客户子集的交互进行抽样分析,这是首次此类分析。3倾向于为企业和开发者的API客户使用Claude的方式与通过Claude.ai访问的用户截然不同:他们按令牌付费,而非固定月度订阅,并且可以通过自己的程序发出请求。

这些客户对Claude的使用特别集中在编程和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(巧合的是,大约5%的所有API流量专门集中在开发和评估AI系统上。)这与教育职业相关的对话比例较小(API上为4%,Claude.ai上为12%)以及艺术和娱乐(API上为5%,Claude.ai上为8%)形成对比。

我们还发现,API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。我们77%的API对话显示自动化模式,其中绝大多数是指令性的,而只有12%显示增强模式。在Claude.ai上,比例几乎持平。这可能产生重大经济影响:过去,任务自动化与重大经济转型以及生产力的显著提高相关联。

显示Claude.ai上增强用途比API高得多,而自动化用途则相反

Claude.ai与API上的Claude增强和自动化使用情况。

最后,鉴于API的使用方式,我们还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异是否影响企业选择"购买"的任务。在这里,我们发现价格和使用之间存在_正_相关:较高成本的任务类别往往使用频率更高,如下图所示。这向我们表明,基本模型能力和模型产生的经济价值对企业来说比完成任务本身更重要。

显示职业类别使用份额与平均API成本的图表

按任务类别划分的平均成本与该类别占总对话的份额。

结论:AI经济影响的初步评估

经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。到目前为止,我们发现了什么?

在本报告涵盖的每个衡量指标中,AI的采用似乎极不均衡。高收入国家的人们更有可能使用Claude,更倾向于寻求协作而非自动化,更有可能追求编程之外的广泛用途。在美国,AI使用似乎受到当地经济主导行业的强烈影响,从技术到旅游业。而且企业比消费者更可能委托Claude代理和自主权。

除了不均衡的事实外,特别值得注意的是,在过去九个月中,指令性自动化在Claude.ai对话中变得更加常见。人们使用Claude的性质显然仍在被定义:我们仍在集体决定对AI工具有多少信心,以及应该给予它们多少责任。然而,到目前为止,看起来我们正在对AI越来越舒适,并愿意让它代表我们工作。我们期待随着时间的推移重新分析这一情况,看看随着AI模型的改进,用户的选择将在哪里——或者,确实,是否——趋于稳定。

如果您想亲自探索我们的数据,可以在我们专门的Anthropic经济指数网站上进行,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,让您能够继续以您感兴趣的方式跟踪AI对工作和经济的影响演变。

我们的完整报告可在此处获取。我们希望它有助于政策制定者、经济学家和其他人更有效地为AI提供的经济机遇和风险做好准备。

开放数据与研究展望

与过去的报告一样,我们为本期发布提供了一个综合数据集,包括地理数据、任务级使用模式、按任务分类的自动化/增强细分以及API使用概述。数据可在Anthropic经济指数网站下载。

随着AI技术的快速发展,未来的研究将需要持续跟踪以下几个关键方向:

  1. 经济影响深化:随着AI采用率的提高,我们需要更精确地量化其对不同行业、地区和技能水平工人的具体影响。

  2. 政策响应:政策制定者需要基于实证数据制定适当的监管框架,平衡创新与就业保护之间的关系。

  3. 技能转型:教育系统需要适应AI时代的需求,培养人机协作所需的独特技能组合。

  4. 全球不平等:研究应关注AI技术可能加剧或缓解的全球不平等问题,确保技术红利的广泛分享。

通过持续的数据收集和分析,AI经济指数将成为理解这一 transformative 技术如何塑造我们经济未来的关键资源。