AI经济指数报告:全球人工智能应用的不平等格局

2

人工智能正在以前所未有的速度融入全球经济,但其应用模式呈现出显著的不平等特征。Anthropic最新发布的第三份经济指数报告通过分析Claude的使用数据,揭示了AI在全球不同地区、行业和用户群体中的差异化应用趋势。这些发现不仅反映了当前AI技术的采用现状,也预示着未来可能出现的经济格局变化。

地理差异:AI应用的不平等分布

国家间的AI采用差距

数据显示,美国在Claude使用方面遥遥领先,占全球使用份额的21.6%,其次是印度、巴西、日本和韩国,这些国家的使用份额相近。然而,考虑到各国人口规模的巨大差异,Anthropic研究人员创建了"Anthropic AI使用指数"(AUI),通过调整各国使用份额与工作年龄人口的比例,来更准确地反映AI采用的真实情况。

全球Claude使用前30国家:美国以21.6%领先

全球Claude.ai使用份额领先的国家。

AUI指数显示,一些小型技术先进国家如以色列、新加坡、澳大利亚、新西兰和韩国在Claude采用方面相对其工作年龄人口比例处于领先地位。研究发现,人均GDP与AUI指数之间存在强相关性(人均GDP每提高1%,AUI提高0.7%)。这表明,使用Claude最频繁的国家通常也拥有强大的互联网连接和以知识工作为导向的经济结构。

Anthropic AI使用指数最高的20个国家:以色列、新加坡、澳大利亚、新西兰和韩国位居前五

Anthropic AI使用指数最高的20个国家。

显示各国人均Claude使用量与人均收入呈正相关关系的图表

各国人均Claude使用量与人均收入呈正相关关系。(坐标轴为对数刻度)

美国各州的经济结构影响

在美国国内,人均GDP与人均Claude使用量之间的关联同样存在,且这种关联在国内比国家间更为明显:人均GDP每提高1%,人口调整后的Claude使用量提高1.8%。然而,收入在美国国内对使用差异的解释力弱于国家间的比较,表明其他因素在解释使用差异方面更为重要。

研究人员推测,各州经济结构的差异可能是造成这种采用差距的主要原因。美国AUI最高的是哥伦比亚特区(3.82),其中最不成比例频繁使用Claude的任务包括编辑文档和搜索信息等与知识工作相关的任务。同样,加利福尼亚州(整体AUI第三高)的编码相关任务特别常见,而纽约州(第四位)的金融相关任务则特别普遍。即使在夏威夷等人口调整后Claude使用量较低的地区,使用情况也与经济结构密切相关:夏威夷居民请求Claude协助旅游相关任务的频率是美国其他地区的两倍。

显示美国各州相对于其工作年龄人口的Claude采用情况,犹他和哥伦比亚特区领先

美国各州相对于其工作年龄人口的Claude采用情况。

Claude使用趋势:从协作到自动化的转变

自2024年12月以来,Anthropic一直在跟踪人们如何使用Claude。研究人员采用一种隐私保护的分类方法,将匿名对话转录本分类到由O*NET(美国政府分类工作和相关任务的数据库)定义的任务组中。这种方法使研究人员能够分析自去年以来人们给Claude的任务如何变化,以及人们选择协作的方式——他们对Claude工作的监督和输入程度——如何变化。

任务模式的变化

自2024年12月以来,计算机和数学类别的Claude使用在我们的分类中占主导地位,代表约37-40%的对话。

然而,许多方面已经改变。在过去的九个月里,我们观察到"知识密集型"领域的持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%增至13%),与物理和社会科学相关的任务份额增加了三分之一(从6%增至8%)。与此同时,传统商业任务的相对频率有所下降:管理相关任务从所有对话的5%降至3%,与商业和金融运营相关的任务份额减半,从6%降至3%。(当然,从绝对数量来看,每个类别的对话数量仍然显著增加。)

Claude使用随时间的变化,显示科学和教育任务的使用增加,而艺术、商业和建筑用途的使用减少

Claude使用随时间的变化,显示科学和教育任务的使用增加。

总体趋势虽然有些波动,但一般来说,随着国家人均GDP的增加,Claude的使用逐渐远离计算机和数学职业组的任务,转向更多样化的其他活动,如教育和艺术设计;办公室和行政支持;以及物理和社会科学。比较下图中的第一条趋势线与剩余三条:

计算机和数学、教育指导、艺术以及办公室和行政任务的职业组份额与Anthropic AI使用指数的关系

随着我们从采用率较低的国家向采用率较高的国家移动,Claude使用似乎转向更多样化的任务组合,尽管整体模式有些波动。

尽管如此,软件开发仍然是我们在跟踪的每个国家中最常见的用途。在美国的情况也类似,尽管我们的样本量限制了我们在更大范围内探索任务组合如何随采用率变化的细节。

交互模式的演变

正如我们之前讨论的,我们通常区分涉及_自动化_(AI直接生成工作,用户输入最少)和_增强_(用户和AI协作完成任务)的任务。我们进一步将自动化分解为_指令性_和_反馈循环_交互,其中指令性对话涉及最少的人类互动,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。

自2024年12月以来,我们发现指令性对话的份额急剧上升,从27%增至39%。其他交互模式(特别是学习、任务迭代和反馈循环)的份额因此略有下降。这意味着,自动化(49.1%)首次在总体上超过了增强(47%)。一个可能的解释是,AI正在迅速赢得用户的信任,并越来越负责完成复杂的工作。

这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产生高质量工作方面变得更好,用户可能更愿意在第一次尝试时就信任模型的输出。

从我们的第一份到第三份指数报告,自动化超过增强的图表

自动化似乎随时间增加。

令人惊讶的是,在人均Claude使用量较高的国家,Claude的用途倾向于增强,而使用量较低国家的人们则更倾向于自动化。在控制相关任务组合的情况下,人口调整后的Claude使用量每增加1%,自动化减少约3%。同样,人口调整后的Claude使用量增加与远离自动化(如下图所示)而非向自动化转变相关。

我们尚不确定为什么会这样。这可能是因为每个国家的早期采用者感到更舒适,允许Claude自动化任务,或者这可能归因于其他文化和经济因素。

显示人均Claude使用量较高的国家往往有较低比例的自动化任务的图表

人均Claude使用量较高的国家倾向于以更协作的方式使用Claude。

企业与消费者的AI采用差异

使用我们在Claude.ai对话中使用的相同隐私保护方法,我们开始对Anthropic第一方API客户的一部分交互进行抽样分析,这是首次此类分析。API客户(通常是企业和开发者)使用Claude的方式与通过Claude.ai访问的用户截然不同:他们按token付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。

这些客户对Claude的使用特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上为36%。(巧合的是,大约5%的所有API流量专门用于开发和评估AI系统。)这被与教育职业相关的对话比例较小(API上为4%,Claude.ai上为12%)以及艺术和娱乐(5%对8%)所抵消。

我们还发现,API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。我们77%的API对话显示出自动化模式,其中绝大多数是指令性的,而只有12%显示出增强。在Claude.ai上,比例几乎平分。这可能具有重要的经济意义:过去,任务的自动化与重大的经济转型以及生产力的显著提高相关。

显示Claude.ai上增强用途的比例远高于API,反之亦然用于自动化用途的图表

Claude.ai与API上的Claude增强和自动化。

最后,考虑到API使用是如何付费的,我们还可以探索任务成本(由它们消耗的token数量差异引起)的差异是否影响企业选择"购买"哪些任务。在这里,我们发现价格与用途之间存在_正相关_:成本较高的任务类别往往使用频率更高,如下图所示。这向我们表明,基本模型能力和模型产生的经济价值对企业来说比完成任务本身的成本更重要。

将职业类别的使用份额与平均API成本绘制的图表

任务成本与任务类别占总对话份额的关系。

经济影响与未来展望

经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。到目前为止,我们发现了什么?

在本报告涵盖的每个衡量标准中,AI的采用似乎都极不均衡。高收入国家的人们更有可能使用Claude,更有可能寻求协作而非自动化,更有可能追求编码之外的广泛用途。在美国,AI使用似乎受到当地经济主导产业的强烈影响,从技术到旅游业。而且企业比消费者更可能信任Claude的代理和自主性。

除了不平等的事实外,特别值得注意的是,在过去的九个月里,指令性自动化在Claude.ai对话中变得普遍得多。人们使用Claude的性质显然仍在被定义:我们仍在集体决定我们对AI工具有多少信心,以及我们应该给予它们多少责任。然而,到目前为止,看起来我们正在对AI变得越来越舒适,并愿意让它代表我们工作。我们期待随着时间的推移重新审视这一分析,看看随着AI模型的改进,用户的选择将如何 settled。

如果您想自己探索我们的数据,可以在我们专门的Anthropic经济指数网站上进行,该网站包含我们国家、州和职业数据的交互式可视化。我们将在未来用更多数据更新此网站,以便您继续以您感兴趣的方式跟踪AI对工作和经济的影响。

我们的完整报告在此处提供。我们希望它能够帮助政策制定者、经济学家和其他人更有效地为AI提供的经济机会和风险做好准备。

开放数据与研究方法

与之前的报告一样,我们为本发布版本发布了一个全面的数据集,包括地理数据、任务级使用模式、按任务分解的自动化/增强情况以及API使用概述。数据可在Anthropic经济指数网站下载。

我们的隐私保护分析方法的完整细节可在此处获得。我们使用一种结合O*NET分类和Claude自身分类的混合方法,确保任务分类的全面性。对于API数据分析,我们采样了2025年8月的一百万份转录本,随机来自构成我们约一半1P API使用量的1P API客户池。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和合同协议。

这些数据不仅为研究人员提供了宝贵的资源,也为政策制定者提供了了解AI经济影响的实证基础。随着AI技术的不断发展,这类定期更新的数据集将成为追踪技术变革经济影响的关键工具。