引言:AI技术采用的独特速度
人工智能技术的采用速度远超以往任何技术。仅在美国,就有40%的员工报告在工作中使用AI,而两年前这一比例仅为20%。这种快速采用反映了AI技术对广泛应用的实用性、在现有数字基础设施上的可部署性以及无需专门培训即可通过打字或语音轻松使用的特点。前沿AI的持续改进可能从多个维度强化了这种快速采用。
历史上,新技术需要数十年才能实现广泛采用。电力在城市电气化后花了30多年才到达农村家庭;第一台面向大众市场的个人电脑于1981年进入早期采用者手中,但又过了20年才进入美国大多数家庭。即使是快速普及的互联网也花了大约五年时间达到AI在短短两年内实现的采用率。
为什么AI采用如此集中?
新技术——即使是变革性技术——需要时间在整个经济中扩散,消费者采用需要减少地理集中度,企业需要重组业务运营以最好地解锁新的技术能力。企业采用,首先针对有限的任务集,然后针对更通用的应用,是重要技术传播和具有变革性经济影响的重要方式。
换句话说,早期技术采用的一个标志是它具有集中性——无论是在少数地理区域还是企业中的少数任务上。正如我们在本报告中记录的那样,AI采用似乎在21世纪遵循了类似的模式,尽管时间线比20世纪的技术扩散更短,强度更大。
Claude.ai使用模式的演变
在本报告的第一章中,我们确定了Claude.ai在前八个月内使用 notable 的变化,这些变化伴随着底层模型能力的改进、新产品功能的推出以及Claude消费者群体的扩大。
关键发现:
- 教育和科学使用份额上升:尽管Claude用于编程的使用在我们的总样本中仍占主导地位(36%),但教育任务从9.3%跃升至12.4%,科学任务从6.3%增至7.2%。
- 用户赋予Claude更多自主权:用户将完整任务委托给Claude的"指令式"对话从27%跃升至39%。我们看到编程中的程序创建增加了4.5个百分点,调试减少了2.9个百分点——这表明用户可能能够在单次交互中实现更多目标。
AI采用的地域差异
我们首次发布了150多个国家和所有美国州的Claude.ai使用数据地理分布。为了研究扩散模式,我们引入了Anthropic AI使用指数(AUI)来衡量Claude.ai的使用相对于其劳动年龄人口是否被过度或代表不足。
全球AI采用的关键发现:
- AUI与收入高度相关:与以往的技术一样,我们看到AI使用在地理上高度集中。新加坡和加拿大在人均使用率方面位居前列,分别是基于其人口的预期使用率的4.6倍和2.9倍。相比之下,包括印度尼西亚(0.36倍)、印度(0.27倍)和尼日利亚(0.2倍)在内的新兴经济体使用Claude较少。
- 在美国,当地经济因素塑造使用模式:哥伦比亚特区领先人均使用率(3.82倍人口份额),但犹他州紧随其后(3.78倍)。有证据表明区域使用模式反映了当地经济的独特特征:例如,加利福尼亚IT使用率高,佛罗里达金融服务使用率高,哥伦比亚特区和文档编辑及职业援助使用率高。
- 领先国家使用更加多样化:采用率较低的国家往往看到更多的编程使用,而高采用率地区则显示出教育、科学和商业的多样化应用。例如,在印度,编程任务占所有使用的一半以上,而全球约占三分之一。
- 高采用国家采用自动化程度较低,增强程度较高:在按国家控制任务组合后,低AUI国家更可能委托完整任务(自动化),而高采用地区倾向于更多的学习和人机迭代(增强)。
早期AI采用的不均衡地理对经济收敛的影响
19世纪末和20世纪初的变革性技术——广泛的电气化、内燃机、室内管道——不仅开启了现代经济增长时代,还伴随着全球生活水平的巨大差异。如果高采用经济体的生产力增益更大,当前的使用模式表明AI的好处可能集中在已经富裕的地区——可能增加全球经济不平等,并逆转近几十年来 seen 的增长趋同。
系统性企业AI部署
在最后一章中,我们首次对我们大量第一方(1P)API流量提供了见解,揭示了公司和开发人员使用Claude完成的任务。重要的是,API用户通过编程方式访问Claude,而不是通过网络用户界面(如Claude.ai)。这展示了早期采用企业如何部署前沿AI能力。
企业API使用的关键发现:
- 1P API使用与Claude.ai使用相似但有专业差异:1P API使用和Claude.ai使用都专注于编程任务。然而,1P API在编程和办公/行政任务上的使用率更高,而Claude.ai在教育写作任务上的使用率更高。
- 1P API使用以自动化为主导:77%的企业使用涉及自动化使用模式,而Claude.ai用户约为50%。这反映了API使用的程序性质。
- 能力在塑造企业部署中比成本更重要:我们API数据中最常用的任务往往比不太常用的任务成本更高。总体而言,我们发现价格敏感度弱的证据。模型能力和可行地自动化给定任务的经济价值似乎在塑造企业使用模式方面发挥更大作用。
- 背景限制复杂使用:我们的分析表明,为模型整理正确的背景对于在复杂领域实现AI的高影响部署很重要。这意味着对于一些公司来说,昂贵的现代化和 eliciting 上下文信息的组织投资可能是AI采用的瓶颈。
开源数据促进独立研究
与之前的报告一样,我们已经开源了底层数据,以支持关于AI经济影响的独立研究。这个全面的数据集包括Claude.ai和1P API流量的任务级使用模式(映射到O*NET分类法以及自下而上的类别),按任务划分的协作模式细分,以及我们方法的详细文档。目前,地理使用模式仅适用于Claude.ai流量。
地理AI采用:全球格局
总体Claude使用量在美国最高
总体而言,Claude采用在地理上高度集中。在全球总使用量方面,美国占比最高(21.6%),其次是使用量明显较低的国家(印度7.2%,巴西3.7%)。然而,这种集中受到各国人口规模的影响——较大的国家可能因其人口规模而有更大的使用份额。
Claude的人均使用集中在技术先进国家
为了考虑人口规模的差异,我们分析了按劳动年龄人口调整的使用情况,引入了一个名为Anthropic AI使用指数(AUI)的新衡量标准:对于每个地理区域,我们计算其Claude使用份额及其劳动年龄人口(15-64岁)的份额。然后我们通过除以这些份额来计算AUI:
AUI = (某地区Claude使用份额) / (某地区劳动年龄人口份额)
这个指数揭示了一个国家相对于其劳动年龄人口使用Claude是多还是少。AUI > 1的地区在调整人口后使用率高于预期,而AUI < 1的地区使用率低于预期。
结果揭示了小型技术先进经济体的显著集中模式。以色列以Anthropic AI使用指数7引领全球人均Claude使用——这意味着其劳动年龄人口使用Claude的频率是基于其人口的7倍。新加坡以4.57位居第二,澳大利亚(4.10)、新西兰(4.05)和韩国(3.73)则完成了人均Claude使用的前五名国家。
人均采用 tiers
我们基于AUI创建了人均使用分层。我们查看在我们的100万次对话随机样本中至少有200次对话的国家,并为不同的使用层设置阈值,即领先(前25%)、中上(50-75%)、中下(25%-50%)和新兴(后25%)。然后,即使这些国家少于200次观察,我们也根据其AUI将其分配到一个层级。我们为有人口数据但样本中没有使用的国家分配最小层级。
领先和新兴国家的深入分析
这种先进经济体有限人口规模的集中反映了它们作为技术先驱的既定模式。例如,以色列和新加坡在全球创新指数中均排名靠前——这是衡量全球不同经济体创新程度的指标——表明对信息技术的总体投资使经济体能够快速采用前沿AI。总体而言,这些经济体可以利用其受过教育的劳动力、强大的数字基础设施和创新友好的政策,为AI创造有利条件。
值得注意的是主要发达经济体在Claude使用中的地位。美国(3.62)在人均采用方面位居领先国家之列,加拿大(2.91)和英国(2.67)的采用率相对于其人口较高但较为适中。其他主要经济体采用率较低,包括法国1.94、日本1.86和德国1.84。
与此同时,许多中低收入经济体Claude使用量 minimal,非洲、拉丁美洲和亚洲许多地区的Claude采用率低于基于其劳动年龄人口的预期。这包括玻利维亚(0.48)、印度尼西亚(0.36)、印度(0.27)和尼日利亚(0.2)。
这种使用差异反映了这些经济体之间的收入差异。我们看到Claude采用与人均国内生产总值之间存在强烈的正相关关系,人均GDP每增长1%与人均Claude使用增长0.7%相关。
美国国内的AI采用差异
在美国,加利福尼亚州以25.3%的使用量遥遥领先。其他主要技术中心州如纽约(9.3%)、德克萨斯州(6.7%)和弗吉尼亚州(4.0%)也排名靠前。虽然未按人口调整,但我们怀疑这些强劲的采用数字部分反映了技术中心的快速采用——这与历史上具有经济重要性的技术往往倾向于扩散的方式一致。
然而,当我们调整每个州的人口规模时,情况变得更加复杂。令人惊讶的是,哥伦比亚特区以Anthropic AI使用指数3.82领先,表明哥伦比亚特区的Claude使用率是其国家劳动年龄人口份额的3.82倍。紧随其后的是犹他州(3.78),明显领先于加利福尼亚州(2.13)、纽约州(1.58)和弗吉尼亚州(1.57)。
国家间任务使用模式的差异
我们观察到不同国家Claude使用方式存在显著差异。与过去的报告一样,我们使用两种不同的方法分析这些趋势。首先,我们根据O*NET(美国分类法,将特定任务映射到职业和职业组)将对话分类为任务。其次,我们使用Claude构建Claude.ai用户请求的自下而上分类法,这提供了不符合现有分类法的使用模式的见解。
较高的人均Claude使用与更多样化的任务使用相关
当分析在最高级别汇总的O*NET任务(它们所属的标准职业分类职业组)时,我们注意到各国之间存在强烈差异。虽然整体模式嘈杂——特别是对于观察次数较少的国家——图2.7表明,随着我们从较低人均Claude采用国家向较高采用国家进展,使用从计算机和数学职业组的任务(如编程)转向更多样化的任务,如教育、办公和行政用途以及艺术。我们还看到生命、物理和社会科学的使用增加。
地理模式中的人机协作
虽然前面的部分研究了人们使用Claude的_什么_任务,但在_如何_与之互动方面也出现了一个同样揭示性的模式。在这里,我们使用与第一章相同的增强和自动化协作模式。
不同国家的任务组合不同,这意味着它们专注于不同的经济任务,这可能在一定程度上解释了自动化模式的差异。在本节中,我们调查即使在控制任务组合差异后,低和高人均采用经济体的自动化使用是否系统性地不同。
我们发现,即使在控制国家的任务组合后,来自不同国家的用户在自主委托与协作互动方面显示出明显不同的偏好。随着人均Claude使用量的增加,国家从以自动化为重点转向以增强为重点的使用。这有点违反直觉,因为我们控制了不同国家之间更多样化的任务组成。我们推测文化和经济因素可能会影响自动化份额,或者每个国家的早期采用者倾向于以更汽车化的方式使用AI——但需要更多研究。
企业AI部署:API数据洞察
企业AI采用现状
在企业AI采用方面,美国普查局的商业趋势和前景调查显示,美国企业的AI采用率在过去两年翻了一番,从2023年秋天的3.7%上升到2025年8月初的9.7%。尽管这一增长率很高,但美国绝大多数公司报告在生产过程中未使用AI。
但这些总体数字掩盖了各行业之间的巨大差异。例如,2025年8月初,信息行业中每四家企业就有一家报告使用AI,这大约是住宿和餐饮服务业的十倍。
Anthropic API客户的专门使用
为了分析API流量,我们应用了前几章相同的隐私保护分类方法——将匿名API转录分类为O*NET任务并进入自下而上的分类法。出现的模式表明企业使用集中在特别适合自动化的专门任务。
总体而言,软件开发占据主导地位。在前15个使用集群中——约占所有API流量的一半——大多数与编码和开发任务相关。调试Web应用程序和解决技术问题各占约6%的使用量,而构建专业业务软件代表了另一大部分。值得注意的是,约5%的API流量专门用于开发和评估AI系统本身。
但并非所有API使用都用于编程。API客户还部署Claude来创建营销材料(4.7%)和处理业务和招聘数据(1.9%)。这两个类别表明,AI不仅被用于直接生产和提供服务,还被用于人才获取和外部沟通。
职业分割与任务专业化
尽管服务于具有不同界面的不同用户,但API和Claude.ai使用在任务方面遵循相似的幂律分布。在Claude.ai对话中,底部80%的任务类别仅占12.7%的使用量;对于API客户,则更为集中,为10.5%。这些极端集中(基尼系数为0.84和0.86)揭示了AI-任务匹配的巨大变化——最佳匹配任务的使用量比 poorly 匹配任务高出几个数量级。
考虑到用户群体和用例的不同,这些平台之间的相似性尤其显著。两者都汇聚到类似的集中水平,表明AI能力与相关经济任务之间存在共同的匹配过程。
API转录中的自动化与增强
API和Claude.ai使用之间最明显的区别在于_人类和AI如何划分工作_。当企业将Claude嵌入其应用程序时,他们主要委托个别任务,而不是与模型迭代协作。
在我们的数据中,77%的API转录显示自动化模式(特别是完整任务委托),而增强(例如协作改进和学习)仅为12%。基于Claude.ai的对话样本,自动化和增强的分配几乎平均。跨经济任务来看,通过API实现的Claude自动化程度甚至更为明显:97%的任务在API使用中显示主导自动化模式,而在Claude.ai上仅为47%。
Claude做得越多,需要知道的信息越多
为什么我们的API客户对某些任务的使用多于其他任务?除了基本的模型能力外,一个潜在的重要解释是,对于某些任务,提供成功部署所需的信息比其他任务更容易。
例如,如果目标是让Claude重构复杂软件开发项目中的一个模块,Claude可能需要阅读——至少探索——整个代码库以了解要进行哪些更改以及在哪里进行。对于具有集中式代码库的软件开发,原则上访问这些信息是直接的。
对于其他任务,适当的上下文可能不容易获得,或者可能难以访问。例如,要求Claude为关键客户制定销售策略可能需要Claude不仅访问客户关系管理系统中的信息,还需要访问客户经理、营销人员和外部联系人头脑中的隐性知识。在其他条件相同的情况下,缺乏此类上下文信息将使Claude能力降低。
我们通过查看API输入长度(即提供给Claude的上下文)和Claude平均输出长度(即模型在响应中产生的内容)之间的关系来探讨这个问题。
对于样本中的每个O*NET任务,我们计算相关API转录的平均输入和输出长度。然后我们将这些值除以样本中所有任务的平均长度。这为每个任务生成了一个输入token指数和输出token指数。例如,指数值为1.5意味着与该任务相关的API转录比样本中所有任务的平均长度长50%。
跨任务来看,Claude的API输出长度存在很大差异。例如,输出长度处于第90百分位的任务比处于第10百分位的任务长4倍以上。表3.1提供了O*NET任务的示例,以及Claude Sonnet 4对该分布部分任务的总结。
从Claude对任务的评估中可以看出,较长的输出任务往往代表越来越复杂的使用。当然,输出长度并没有捕捉任务复杂性的所有维度,但它似乎是一个合理的、易于衡量的代理。
因为API客户按输入和输出token的边际价格付费,所以他们有动力优化模型提示以最小化使用Claude时的输入和输出token。反过来,Claude产生的输入长度和输出长度之间的任何系统关系部分地捕获了在部署Claude处理复杂任务时的潜在上下文约束。换句话说,API客户有动力只向Claude提供足够完成其目标的上下文,不多也不少。因此,我们了解了具有不同输出长度的任务的上下文要求。
跨任务来看,我们看到API客户向Claude提供的上下文量与Claude实际产生的内容之间存在非常稳定的关系。跨经济任务,输入长度每增加1%,输出长度增加不到成比例的0.38%(图3.7)。这种0.38的弹性表明,在这些经济有用的任务中,较长的上下文输入转化为较长的输出存在强烈的边际收益递减。
每个任务的成本与任务间的替代模式
API客户按token付费,这导致部署Claude执行不同任务的成本存在差异。更复杂的任务由于其更高的输入和输出token计数往往会花费更多。这种差异帮助我们探索成本是否是决定企业选择使用Claude自动化的任务的主要因素。
数据表明不是,至少相对而言。例如,计算机和数学职业的典型任务比销售相关任务的成本高出50%以上,但却主导了使用。总体而言,我们发现成本和使用之间存在正相关:较高成本的任务往往有较高的使用率。
虽然这种正相关总体上成立,但我们接下来询问在任务特征相似但成本更高的任务中,对Claude能力的需求是否较低。需要强调的是,这应被视为初步探索,但我们的发现如下。
在控制任务特征后,我们发现API转录样本中每个1%的成本增加与0.29%的使用频率减少相关。虽然符合较高价格导致需求较低的标准经济理论,但成本下降带来的使用增加有限。根据此估计,特定任务成本降低10%只会使使用量增加约3%。
除使用Claude执行特定任务的成本外,其他因素似乎对使用模式更为重要。
结论:AI经济影响的不平等模式
我们的API数据捕捉了企业AI采用的早期阶段:高度集中、以自动化为重点,并且令人惊讶的是价格不敏感(至少在我们API客户使用Claude的任务中)。
77%的自动化率表明企业使用Claude来委托任务,而不是作为协作工具。这种系统部署可能是AI在整个经济中提供更广泛生产力收益的重要渠道。鉴于企业部署中存在明显的自动化模式,这也可能给劳动力市场带来干扰,可能取代那些角色最有可能面临自动化的工人。
但劳动力市场的影响并不完全清楚。如上所述,复杂任务需要不成比例的更多上下文。此类信息可能分散在组织中。在这种情况下,对业务运营具有隐性知识的工人可能会受益,作为复杂AI驱动自动化的补充。理解AI采用的不平等劳动力市场影响是未来研究的重要领域。
希望有效采用AI的企业可能需要重组他们组织和维护前沿系统所依赖信息的方式。当今狭隘、以自动化为重点的采用是否会发展为更广泛的部署,可能决定AI未来的经济影响。
政策启示与未来展望
AI采用的不平等模式提出了重要的政策问题。如果AI的生产力增益集中在已经繁荣的地区和自动化就绪的行业,现有的不平等可能会扩大而非缩小。如果AI自动化提高了具有组织隐性知识的工人的生产力——我们的一些证据表明——那么即使是入门级工人面临更差的劳动力市场前景,经验丰富的工人也可能看到需求上升和工资提高。
历史表明,技术采用的模式并非固定不变:它们随着技术的成熟、互补创新的出现以及社会对其部署的 deliberate 选择而转变。我们今天观察到的高度集中使用模式可能会演变为更广泛的分布——这种分布捕捉了AI更多的生产力增强潜力,加速了落后行业的创新,并 enables 新形式的经济价值创造。我们仍处于AI驱动经济转型的早期阶段。政策制定者、商业领袖和公众现在采取的行动将塑造未来几年。我们将随着AI能力的进步继续跟踪这些模式,并为驾驭我们这个时代最重要的经济转型之一提供经验基础。
最终,变革性AI的经济影响将受到技术能力与社会政策选择同等程度的影响。