引言:前所未有的技术扩散速度
人工智能技术展现出与以往技术截然不同的采用速度。仅在美国,就有40%的员工报告在工作中使用AI,这一比例在2023年仅为20%。1 这种快速采用反映了AI技术对广泛应用的实用性、在现有数字基础设施上的可部署性以及通过简单输入即可使用的便捷性。前沿AI的持续改进可能进一步强化这些方面的快速采用。
历史上,新技术需要数十年才能实现广泛采用。电力在城市电气化后花了30多年才进入农村家庭;首批面向大众的个人电脑于1981年到达早期采用者手中,但又过了20年才进入美国大多数家庭;即使是快速普及的互联网也花了大约五年时间才达到AI在两年内实现的采用率。2
早期技术采用的模式:集中性
新技术——即使是变革性技术——需要时间才能在整个经济中扩散,消费者采用才能减少地理集中度,企业才能重组业务运营以最好地解锁新的技术能力。企业采用,首先针对狭窄的任务集,然后针对更通用的应用,是重要技术传播和具有变革性经济影响的重要方式。3
简而言之,早期技术采用的一个标志是它的集中性——无论是在少数地理区域还是在企业中的少数任务中。正如本报告所记录的那样,AI采用在21世纪似乎遵循了类似的模式,尽管时间线比20世纪的技术扩散更短,强度更大。
为了研究这种早期AI采用模式,我们扩展了Anthropic经济指数,引入了Claude对话的地理分析和企业API使用的首次检查,展示了Claude使用如何随时间演变,不同地区的采用模式如何不同,以及企业如何首次部署前沿AI来解决业务问题。
Claude.ai使用模式的时间变化
在本报告的第一章中,我们确定了过去八个月Claude.ai使用中的显著变化,这些变化伴随着底层模型能力的改进、新产品功能的推出以及Claude消费者基础的扩大。
关键发现:
- 教育和科学使用份额上升:尽管Claude用于编码的使用在我们的总样本中仍占主导地位36%,但教育任务从9.3%跃升至12.4%,科学任务从6.3%增至7.2%。
- 用户赋予Claude更多自主权:用户将完整任务委托给Claude的"指令性"对话从27%跃升至39%。我们看到编码中的程序创建增加了4.5个百分点,调试减少了2.9个百分点——这表明用户可能能够在单次交流中实现更多目标。
AI采用的地理分布
我们首次发布了150多个国家和美国所有州的Claude.ai使用数据地理细分。为了研究扩散模式,我们引入了Anthropic AI使用指数(AUI)来衡量Claude.ai使用在经济中相对于工作年龄人口是过度还是不足。
关键发现:
- AUI与收入在国家间高度相关:与以往技术一样,我们看到AI使用在地理上集中。新加坡和加拿大的人均使用率分别基于其人口预期的4.6倍和2.9倍,是最高的国家。相比之下,包括印度尼西亚(0.36倍)、印度(0.27倍)和尼日利亚(0.2倍)的新兴经济体使用Claude较少。
- 在美国,当地经济因素塑造使用模式:华盛顿特区领先于人均使用率(3.82倍人口份额),但犹他州紧随其后(3.78倍)。有证据表明区域使用模式反映了当地经济的独特特征:例如,加利福尼亚州IT使用率高,佛罗里达州金融服务使用率高,华盛顿特区文档编辑和职业援助使用率高。
- 领先国家使用更加多样化:采用率较低的国家往往看到更多的编码使用,而高采用地区显示出教育、科学和商业的多样化应用。例如,印度的编码任务占所有使用的一半以上,而全球约占三分之一。
- 高采用国家显示较少自动化、更多增强使用:在控制了国家的任务组合后,低AUI国家更有可能委托完整任务(自动化),而高采用区域倾向于更多的学习和人机迭代(增强)。
早期AI采用的地理不均对经济收敛的影响
早期AI采用的地理不均引发了对经济收敛的重要问题。19世纪末和20世纪初的变革性技术——广泛电气化、内燃机、室内 plumbing——不仅开启了现代经济增长时代,而且伴随着全球生活标准的大幅分化。4
如果高采用经济体的生产率增益更大,当前的使用模式表明AI的好处可能集中在已经富裕的地区——可能增加全球经济不平等,并逆转近几十年来 seen 的增长收敛。5
系统性企业AI部署
在最后一章中,我们首次展示了我们第一方(1P) API流量的大部分见解,揭示了公司和开发人员使用Claude完成的任务。重要的是,API用户通过编程方式访问Claude,而不是通过网络用户界面(如Claude.ai)。这显示了早期采用企业如何部署前沿AI能力。
关键发现:
- 1P API使用与Claude.ai使用相似但专业化:1P API使用和Claude.ai使用都专注于编码任务。然而,1P API在编码和办公/行政任务上的使用率更高,而Claude.ai在教育写作任务上的使用率更高。
- 1P API使用以自动化为主导:77%的企业使用涉及自动化使用模式,而Claude.ai用户约为50%。这反映了API使用的程序性质。
- 能力在塑造企业部署中比成本更重要:我们API数据中最常用的任务往往比不太频繁的任务成本更高。总体而言,我们发现价格敏感度弱的证据。模型能力和经济上可行地自动化给定任务的价值似乎在塑造企业使用模式中起更大作用。
- 上下文限制了复杂使用:我们的分析表明,为模型策划合适的上下文对于AI在复杂领域的部署非常重要。这意味着对于一些公司来说,昂贵的现代化数据和组织投资以提取上下文信息可能是AI采用的瓶颈。
开源数据催化独立研究
与之前的报告一样,我们已经开源了底层数据以支持对AI经济影响的独立研究。这个综合数据集包括Claude.ai和1P API流量的任务级使用模式(映射到O*NET分类以及自下而上的类别),按任务划分的协作模式细分,以及我们方法的详细文档。目前,地理使用模式仅适用于Claude.ai流量。
时间维度上的Claude.ai使用变化
概述
理解AI采用如何随时间演变可以帮助我们预测其经济影响——从生产率提高到劳动力变化。从2024年12月和2025年1月(我们的第一份报告"V1")到2025年2月和3月("V2")再到我们2025年8月("V3")的最新见解的数据,我们可以追踪过去八个月中AI使用如何随能力、产品功能的改进、新用户的采用以及使用变得更加复杂而转变。我们认为下面呈现的证据表明新产品功能已经启用了新的工作形式,而不仅仅是加速现有任务的采用。
经济任务的Claude.ai使用如何变化
教育和科学任务持续相对重要性上升
尽管计算机和数学任务仍然以36%主导整体使用,但我们看到知识密集型领域的持续增长。教育指导和图书馆任务从V1的9%上升到V3的12%。生命、物理和社会科学任务从6%增加到7%。与此同时,商业和财务运营任务的相对份额从6%下降到3%,管理从5%下降到3%。
这种分化表明AI使用可能在涉及知识综合和解释的任务中扩散特别快——可能因为这些任务受益于Claude的推理能力。
新能力正在塑造使用模式
在更细粒度的层面上,我们记录了任务组合的变化,这些变化似乎与V2和V3之间发布的功能相关。例如,搜索电子源和数据库大幅增长(0.03%→0.49%),可能反映了我们3月发布的网络搜索功能。此外,我们还看到基于互联网的研究任务上升(0.003%→0.27%),这与我们4月发布的Research模式一致。1
我们还看到其他类型的变化。与开发教学材料相关的任务增加了1.3个百分点,从0.2%的基础增长到1.5%——增长了6倍以上,可能反映了教育工作者中采用的增长。2 创建多媒体文档增加了0.4个百分点,从0.16%几乎增长到0.55%,可能是由持续使用我们的Artifacts功能在Claude.ai中构建传统和AI驱动的应用程序所驱动。
有趣的是,涉及创建新代码的任务份额增加了一倍多,增加了4.5个百分点(从4.1%到8.6%),而调试和错误修正任务减少了2.8个百分点(从16.1%到13.3%)——净增长7.4个百分点,偏向于创建而非修复代码。这可能表明模型变得越来越可靠,因此用户在解决问题上花费的时间更少,在单次交互中创建东西的时间更多。3
指令性自动化正在加速
与之前的报告一样,我们不仅跟踪人们使用Claude做什么,还跟踪他们如何与Claude协作或委托给Claude。
在高层次上,我们区分使用Claude的_自动化_和_增强_模式:
**自动化**包括专注于任务完成的交互模式:
- 指令:用户给Claude一个任务,它以最少的来回完成它
- 反馈循环:用户自动化任务并根据需要向Claude提供反馈
**增强**专注于协作交互模式:
- 学习:用户向Claude询问各种主题的信息或解释
- 任务迭代:用户与Claude协作迭代任务
- 验证:用户请求Claude对他们工作的反馈
从Claude.ai对话中采样的_指令性_对话份额从2024年底V1的27%跃升至V3的39%。这种增加主要来自_任务迭代_和_学习_互动的减少,意味着显示出自动化使用模式的对话份额大幅增加——仅在八个月内就有显著增加。这是自动化使用首次超过增强使用的报告。
一个解释是这是模型能力提高的结果。随着模型在预测用户需求和首次尝试产生高质量输出方面变得越来越好,用户可能需要更少的后续改进。指令性使用的增加也可能表明用户越来越信任将完整任务委托给AI,这是一种边做边学的形式。4
全球范围内的Claude采用
概述
AI在哪里首先被采用以及如何使用将影响全球的经济成果。通过分析150多个国家和美国各州的Claude使用模式,我们发现了三个关键动态:早期采用者在哪里,他们用AI做什么,以及使用如何随着采用成熟而演变。这些地理模式提供了关于AI经济扩散的现实世界证据,有助于跟踪不同地区在AI采用方面是趋同还是分化,并揭示当地经济特征如何塑造技术部署。
我们的数据,依靠对100万次Claude.ai对话的隐私保护1分析,证实了我们的部分预期,同时也挑战了其他预期。美国以21.6%的总使用量主导,考虑到其规模和高收入,这并不奇怪。但即使在工作年龄人口规模上进行调整,高收入国家的使用率往往也更高。例如,新加坡的使用率是其工作年龄人口所预期的4.5倍,而全球大片地区的使用量 minimal。有趣的是,在美国,华盛顿特区和犹他州的人均使用率超过了加利福尼亚州。
我们还观察到随着人均采用率的加深,AI用例的变化。人均AI采用率较低的国家 overwhelmingly 集中于编码任务——印度所有使用中超过一半,而全球约占三分之一。随着采用成熟,使用多样化,对教育、科学和业务运营的重视程度上升。
更引人注目的是:成熟市场倾向于更协作地使用AI,而新兴市场更可能将完整任务委托给它——这可能反映了不同发展阶段经济体的AI部署方式差异。我们的数据提供了这些地理模式的窗口,并将使我们能够跟踪这些采用差距是缩小、扩大还是随时间变化结构。
全球Claude扩散
美国总Claude使用量最高
Claude总体采用在地理上高度集中。就全球总使用量而言,美国占比最高(21.6%),接下来使用量最高的国家占比明显较低(印度7.2%,巴西3.7%,见图2.1)。然而,这种集中受到各国人口规模的影响3——较大的国家可能纯粹因为人口规模而有更大的使用份额。
Claude人均使用集中在技术先进国家
为了考虑人口规模的差异,我们分析了按工作年龄人口调整的使用情况,引入了一个名为Anthropic AI使用指数(AUI)的新度量:对于每个地理区域,我们计算其Claude使用份额及其工作年龄人口(15-64岁)的份额。然后我们通过除以这些份额来计算AUI:
这个指数揭示了一个地区使用Claude是比其工作年龄人口所预期的更多还是更少。AUI > 1的地区在调整人口后使用率更高,而AUI < 1的地区使用率更低。
结果显示在小型、技术先进经济体中存在显著的集中模式。以色列以Anthropic AI使用指数7领先全球人均Claude使用——意味着其工作年龄人口使用Claude的频率比基于其人口预期的7倍还多。新加坡以4.57位居第二,澳大利亚(4.10)、新西兰(4.05)和韩国(3.73)完成了人均Claude使用的前五名国家。
领先和新兴国家的深入分析
这种在有限人口规模先进经济体中的集中反映了它们作为技术先驱的既定模式。例如,以色列和新加坡在全球创新指数中都排名很高——这是衡量全球经济创新能力的指标——表明对信息技术的总体投资使经济体能够迅速采用前沿AI。总体而言,这些经济体可以利用其受过教育的劳动力、强大的数字基础设施和创新友好的政策,为AI创造有利条件。
值得注意的是主要发达经济体在Claude使用中的地位。美国(3.62)在人均采用方面处于领先国家之列,加拿大(2.91)和英国(2.67)的采用率相对于其人口较高但较温和。其他主要经济体采用率较低,包括法国1.94,日本1.86,德国1.84。
与此同时,许多中低收入经济体显示 minimal Claude使用,非洲、拉丁美洲和亚洲许多国家的Claude采用率低于其工作年龄人口所预期的水平。这包括玻利维亚(0.48)、印度尼西亚(0.36)、印度(0.27)和尼日利亚(0.2)。
这种使用差异反映了这些经济体间的收入差异。我们看到Claude采用与每工作年龄人均国内生产总值之间存在强烈的正相关关系(见图2.4),人均GDP每增加1%,人均Claude使用率就增加0.7%。
美国国内的Claude扩散
在美国,加利福尼亚州以25.3%的使用量绝对领先。其他主要科技中心州如纽约(9.3%)、德克萨斯州(6.7%)和弗吉尼亚州(4.0%)也排名很高。虽然没有按人口调整,但我们怀疑这些强劲的采用数字部分反映了科技中心的快速采用——这与历史上经济重要技术的扩散方式一致。
然而,当我们调整各州的人口规模时,情况变得更加复杂。令人惊讶的是,华盛顿特区以Anthropic AI使用指数3.82领先,表明华盛顿特区的Claude使用量是其国家工作年龄人口份额的3.82倍。紧随其后的是犹他州(3.78),明显领先于加利福尼亚州(2.13)、纽约州(1.58)和弗吉尼亚州(1.57)。7
国家间的任务使用模式
我们观察到不同国家Claude使用方式的显著差异。与过去的报告一样,我们使用两种不同的方法分析这些趋势。首先,我们将对话根据O*NET分类,这是一个将特定任务映射到职业和职业组的美国分类法(例如,涉及软件调试的任务将属于计算机和数学职业组)。
其次,我们使用Claude构建Claude.ai用户请求的自下而上分类法,这提供了不符合现有分类法的使用模式见解。例如,请求集群"帮助撰写和改进求职信"(最低级别) feed 到更高级别的集群"帮助求职申请、简历和职业文件"(中间级别),这又 feed 到集群"帮助求职申请、简历和职业发展"(最高级别)。这两种互补的方法使我们能够报告与标准劳动统计数据一致的结果,并捕捉标准分类法可能错过的任务。
更高的人均Claude使用与更多样化的任务使用相关
当分析在最高级别聚合的O*NET任务(根据它们所属的标准职业分类职业组)时,我们注意到国家间的强烈差异。虽然整体模式是嘈杂的——特别是对于观察值较少的国家——图2.7表明,随着我们从较低到较高的人均Claude采用进展,使用从计算机和数学职业组的任务(如编程)转向更多样化的任务,如教育、办公和行政用途以及艺术。我们还看到生命、物理和社会科学的使用增加。
国家间的人机协作模式
虽然前面的部分研究了人们使用Claude做什么,但同样引人注目的模式出现在他们如何与它互动。在这里,我们使用与第一章相同的增强和自动化协作模式。
各国有不同的任务组合,这意味着他们专注于不同的经济任务,这可能在一定程度上解释自动化模式的差异。在本节中,我们调查自动化使用在低和高人均采用经济体中是否系统性地不同——即使控制了任务组合的差异。9
我们发现,即使控制了一个国家的任务组合,来自不同国家的用户在自主委托与协作互动方面显示出明显不同的偏好。随着人均Claude使用的增加,国家从以自动化为重点转向以增强为重点的使用。这有点反直觉,因为我们在控制不同国家间更多样化的任务组合。我们推测文化和经济因素可能会影响自动化份额,或者每个国家的早期采用者倾向于以更自动化的方式使用AI——但这里需要更多研究。
企业Claude的API部署
概述
前沿AI能力是否能让我们更高效、重塑劳动力市场并加速增长,将取决于企业何时以及如何选择部署AI。即使企业认识到AI的潜力,有利可图地采用它可能需要重组生产过程、培训新工人和其他沉没成本投资,以促进有效部署。1
为了了解企业的AI采用模式,我们转向一个新的数据来源:Anthropic的第一方(1P) API客户——再次依赖隐私保护方法2。我们的API允许客户将Claude直接集成到自己的产品和应用程序中,并按使用的token计费,而不是固定订阅费。这与我们前两章关注的Claude.ai代表了 fundamentally 不同的产品体验。
企业API客户的专门化使用
为了分析API流量,我们应用了前几章相同的隐私保护分类方法——将匿名API转录本按O*NET任务分类并进入自下而上的分类法。出现的模式显示企业使用集中在特别适合自动化的专门任务中。
总体而言,软件开发主导了这一领域。在前15个使用集群中——代表大约一半的API流量——大多数与编码和开发任务相关。调试Web应用程序和解决技术问题各占约6%的使用量,而构建专业商业软件代表了另一个重要部分。值得注意的是,约5%的API流量专门用于开发和评估AI系统本身(图3.2)。
但并非所有API使用都用于编码。API客户还部署Claude来创建营销材料(4.7%)和处理业务和招聘数据(1.9%)。这两个类别表明AI不仅用于直接生产商品和服务,还用于人才招聘和外部沟通。
任务专业化的集中度
尽管服务于具有不同界面的不同用户,API和Claude.ai使用在任务上遵循着相似的幂律分布。在Claude.ai对话中,任务类别中底部的80%仅占12.7%的使用量;对于API客户来说更为集中,为10.5%(图3.4)。这些极端的集中度(基尼系数5为0.84和0.86)揭示了AI任务匹配的巨大变化——最佳匹配任务的看到的使用量比 poorly 匹配的任务高出几个数量级。
API转录本中的自动化与增强
API和Claude.ai使用之间最明显的区别在于_人类和AI如何划分工作_。当企业将Claude嵌入其应用程序时,他们主要委托个别任务,而不是与模型协作迭代。
在我们的数据中,77%的API转录本显示出自动化模式(特别是完整任务委托),而增强仅占12%。基于Claude.ai的对话样本,自动化和增强的分割几乎相等。跨经济任务来看,通过API的Claude自动化程度甚至更加明显:97%的任务在API使用中显示出自动化主导模式,而Claude.ai仅为47%(图3.6)。
Claude做的越多,需要知道的越多
为什么我们的API客户在某些任务上使用Claude比其他任务多?除了基本的模型能力外,一个潜在的重要解释是,对于某些任务,提供Claude成功部署所需的信息比其他任务更容易。
例如,如果目标是让Claude重构复杂软件开发项目中的一个模块,Claude可能需要阅读——至少探索——整个代码库以了解进行哪些更改以及在哪里。对于具有集中代码库的软件开发,原则上访问这些信息是直接的。
对于其他任务,适当的上下文可能不容易获得,或者可能难以访问。例如,要求Claude为关键客户制定销售策略可能需要Claude不仅访问客户关系管理系统中的信息,还需要位于客户经理、营销人员和外部联系人头脑中的隐性知识。在其他条件相同的情况下,缺乏此类上下文信息将使Claude能力降低。
每任务成本与任务间的替代模式
API客户按token付费,这导致部署Claude用于不同任务的成本差异。更复杂的任务往往会成本更高,考虑到它们更高的输入和输出token数量。这种差异帮助我们探索成本是否是决定企业选择用Claude自动化哪些任务的主要因素。
数据表明不是,至少相对而言。11 例如,典型计算机和数学职业的任务比销售相关任务成本高出50%以上,但却主导了使用。12 总体而言,我们发现成本和使用之间存在正相关:更高成本的任务往往有更高的使用率(图3.9)。
结论与展望
我们的API数据捕捉了企业AI采用的早期阶段:高度集中、以自动化为主导,并且令人惊讶的是价格不敏感(至少在我们API客户使用Claude的任务中)。
77%的自动化率表明企业使用Claude来委托任务,而不是作为协作工具。这种系统性的部署很可能是AI在整个经济中带来更广泛生产率收益的重要渠道。鉴于企业部署中明显的自动化模式,这也可能给劳动力市场带来颠覆,可能取代那些最有可能面临自动化的工人角色的工人。
但对劳动力市场的影响并不完全清楚。正如我们上面所记录的,复杂任务需要不成比例的更多上下文。此类信息可能分散在组织中。在这种情况下,拥有关于业务运营隐性知识的工人可能作为复杂AI驱动自动化的补充而受益。14 理解AI采用的不均衡劳动力市场影响是未来研究的重要领域。
希望有效采用AI的企业可能需要重组他们组织和维护前沿系统所依赖的信息方式。今天狭隘的、以自动化为主导的采用是否会演变为更广泛的部署,很可能决定AI未来的经济影响。
政策启示
AI技术在全球范围内呈现的地理和企业采用不均现象,对政策制定者提出了重要挑战。如果AI的生产率收益集中在已经繁荣的地区和自动化就绪的行业,现有的不平等可能会扩大而不是缩小。如果AI自动化提高了拥有组织隐性知识工人的生产率——正如我们的一些证据所表明的那样——那么即使入门级工人面临更差的劳动力市场前景,经验丰富的工人也可能看到需求上升和工资提高。
历史表明,技术采用的模式并非固定不变:它们随着技术的成熟、互补创新的出现以及社会对其部署的 deliberate 选择而转变。我们今天观察到的高度集中使用的模式可能会演变为更广泛的分布——这种分布捕捉了AI更多的生产率提升潜力,加速落后行业的创新,并实现新的经济价值创造形式。我们仍处于AI驱动经济转型的早期阶段。政策制定者、商业领袖和公众现在采取的行动将塑造未来几年。我们将随着AI能力的进步继续跟踪这些模式,并为驾驭我们这个时代最重要的经济转型之一提供经验基础。