人工智能(AI)正在以前所未有的速度重塑全球经济和工作方式。Anthropic最新发布的第三期经济指数报告为我们提供了关于AI如何影响全球经济的宝贵见解。通过对Claude使用模式的分析,该报告揭示了AI应用在不同地区、行业和用户群体中的显著差异,为我们理解AI的早期采用模式提供了重要窗口。
地理分布:AI应用的不平等地图
国家层面的AI采用差异
报告显示,美国在Claude使用方面遥遥领先,占全球使用的21.6%。印度位居第二,巴西、日本和韩国紧随其后,这些国家的使用份额相近。然而,考虑到各国人口规模的巨大差异,研究人员创建了"Anthropic AI使用指数"(AUI),通过调整各国使用量与工作年龄人口的比率来更准确地衡量AI采用情况。
AUI数据显示,一些小型、技术先进的国家(如以色列和新加坡)相对于其工作年龄人口而言,在Claude采用方面处于领先地位。这与收入水平密切相关:研究发现人均GDP与Anthropic AI使用指数之间存在强烈相关性(人均GDP每提高1%,AUI提高0.7%)。这一现象表明,使用Claude最频繁的国家通常拥有强大的互联网连接和以知识工作为导向的经济体,而非制造业。
这种相关性引发了对经济分化的担忧:以往通用技术(如电气化或内燃机)既带来了巨大的经济增长,也导致了全球生活标准的巨大差异。如果AI的影响主要在富裕国家体现,这种通用技术可能会产生类似的经济分化效应。
美国各州的AI应用模式
在美国各州之间,人均GDP与人均Claude使用量之间的关联同样存在。事实上,在美国国内,收入与使用量的增长关系比国家间更为迅速:人均GDP每提高1%,人口调整后的Claude使用量提高1.8%。然而,收入在美国各州间的解释力低于国家间,因为整体趋势内的差异更大。
各州经济结构的差异可能是造成这种采用差距的原因。美国AUI最高的是华盛顿特区(3.82),在那里, disproportionate地频繁使用Claude的任务包括文档编辑和信息搜索等与知识工作相关的任务。同样,加州(整体AUI排名第三)的编码相关任务特别常见,而纽约(排名第四)的金融相关任务则特别普遍。即使在夏威夷等人口调整后Claude使用量较低的地区,使用情况也与经济结构密切相关:夏威夷居民请求Claude协助处理旅游相关任务的频率是美国其他地区的两倍。
Claude使用趋势:从协作到自动化的转变
自2024年12月以来,Anthropic一直在跟踪人们如何使用Claude。研究人员采用了一种保护隐私的分类方法,将匿名对话转录本按O*NET(美国政府分类工作和相关任务的数据库)定义的任务组进行分类。这种方法使我们能够分析人们给Claude的任务在过去一年中如何变化,以及人们选择协作的方式(对Claude工作的监督和输入程度)如何变化。
任务模式的演变
自2024年12月以来,计算机和数学用途在所有类别中占主导地位,约占对话的37-40%。然而,许多方面已经发生了变化。在过去的九个月中,"知识密集型"领域持续增长。例如,教育指导任务增长了40%以上(从所有对话的9%增至13%),与物理和社会科学相关的任务份额增加了三分之一(从6%增至8%)。与此同时,传统商业任务的相对频率有所下降:管理相关任务从所有对话的5%降至3%,与商业和财务运营相关的任务份额减半,从6%降至3%。(当然,从绝对数量来看,每个类别的对话数量仍然显著增加。)
整体趋势虽然有些波动,但通常情况下,随着一个国家人均GDP的增加,Claude的使用从计算机和数学职业组任务转向更多样化的其他活动,如教育、艺术和设计;办公和行政支持;以及物理和社会科学。比较下图中的第一条趋势线与其余三条:
尽管如此,软件开发仍然是我们跟踪的每个国家最常见的用途。在美国的情况也类似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。
交互模式的转变
如前所述,研究人员通常区分涉及_自动化_(AI以最少用户输入直接产生工作)和_增强_(用户和AI协作完成任务)的任务。他们进一步将自动化分解为_指令式_和_反馈循环_交互,其中指令式对话涉及最少的人机交互,而在反馈循环任务中,人类将现实世界的结果反馈给模型。他们还将增强分解为_学习_(请求信息或解释)、任务迭代(与Claude协作工作)和_验证_(请求反馈)。
自2024年12月以来,研究人员发现指令式对话的份额急剧上升,从27%增至39%。其他交互模式(特别是学习、任务迭代和反馈循环)的份额因此略有下降。这意味着自动化(49.1%)首次在整体上变得比增强(47%)更常见。一种可能的解释是,AI正在迅速赢得用户的信任,并承担越来越多的复杂工作责任。
这可能是模型能力改进的结果。(在2024年12月,当我们首次收集经济指数数据时,Claude的最新版本是Sonnet 3.6。)随着模型在预测用户需求和产生高质量工作方面变得更好,用户可能更愿意在第一次尝试时就信任模型的输出。
令人惊讶的是,在人均Claude使用量较高的国家,Claude的用途倾向于增强,而使用量较低国家的人们则更倾向于自动化。在控制相关任务组合的情况下,人口调整后的Claude使用量每增加1%,自动化程度大约减少3%。同样,人口调整后的Claude使用量增加与自动化程度降低(如下图所示)相关,而非增加。
研究人员尚不确定原因。这可能是因为每个国家的早期采用者更愿意让Claude自动化任务,也可能是由于其他文化和经济因素。
企业用户:AI采用的先锋
研究人员使用与Claude.ai对话相同的保护隐私方法,开始对Anthropic部分第一方API客户的交互进行抽样分析,这是首次此类分析。API客户(通常是企业和开发者)使用Claude的方式与通过Claude.ai访问的用户截然不同:他们按令牌付费,而不是固定月度订阅,并且可以通过自己的程序发出请求。
这些客户对Claude的使用特别集中在编码和行政任务上:我们样本中44%的API流量映射到计算机或数学任务,而Claude.ai上则为36%。(巧合的是,大约5%的所有API流量专注于开发和评估AI系统。)这被与教育职业相关的对话比例较小(API上为4%,Claude.ai上为12%)以及艺术和娱乐(5%对8%)所抵消。
研究人员还发现,API客户使用Claude进行任务自动化的频率远高于Claude.ai用户。77%的API对话显示出自动化模式,其中绝大多数是指令式的,而只有12%显示出增强模式。在Claude.ai上,这一比例几乎相当。这可能具有重大的经济意义:过去,任务自动化与重大的经济转型和生产率提高相关。
最后,考虑到API的使用付费方式,研究人员还可以探索任务成本(由它们消耗的令牌数量差异引起)的差异是否影响企业选择"购买"哪些任务。在这里,他们发现使用量与价格之间存在_正相关_:成本较高的任务类别往往使用频率更高,如下图所示。这表明,基本模型能力和模型产生的经济价值对企业来说比完成任务本身的成本更重要。
不平等现象背后的启示
经济指数旨在提供AI如何影响人们工作和经济的早期实证评估。迄今为止,研究人员发现了什么?
在本报告涵盖的每个衡量标准中,AI的采用都表现出显著的不平等。高收入国家的人们更可能使用Claude,更可能寻求协作而非自动化,更可能追求编码之外的广泛用途。在美国,AI使用似乎受到当地经济主导产业的强烈影响,从技术到旅游业。企业比消费者更可能将Claude委托给代理和自主权。
除了不平等现象本身,研究人员特别注意到,在过去九个月内,指令式自动化在Claude.ai对话中变得更加常见。人们使用Claude的性质显然仍在被定义:我们仍在集体决定对AI工具有多少信心,应该给予它们多少责任。然而,到目前为止,我们似乎越来越习惯于AI,并愿意让它代表我们工作。研究人员期待随着时间的推移重新分析这一趋势,看看随着AI模型的改进,用户的选择是否会稳定下来。
这些发现对政策制定者、经济学家和其他希望为AI提供的经济机会和风险做更有效准备的人士具有重要启示。AI的经济影响可能比以往任何通用技术都更加不均衡,这要求我们采取有针对性的策略,确保AI带来的利益能够更广泛地分享,同时减轻可能的经济分化风险。
未来展望
随着AI技术的不断发展和采用率的提高,我们可以预见几个关键趋势:
自动化程度的持续提升:随着用户对AI信任度的增加,指令式自动化可能会继续增长,这将显著提高生产力,但也可能带来就业结构的重大变化。
AI应用的地理分化:高收入国家可能会在AI应用方面进一步领先,这可能导致全球经济发展更加不均衡。政策制定者需要考虑如何缩小这一差距。
企业AI采用的加速:企业用户已经显示出比普通消费者更高的自动化倾向,随着API服务的普及,这种趋势可能会加速,重塑各行各业的工作流程。
任务类型的多样化:随着AI技术的进步,我们可能会看到Claude和其他AI系统被用于更广泛的任务类型,从知识密集型工作到创意领域。
Anthropic计划继续更新其经济指数,跟踪AI对工作和经济的影响。通过开放数据和交互式网站,研究人员希望鼓励更广泛的讨论和研究,帮助社会更好地理解和应对AI带来的变革。
结论
Anthropic的经济指数报告为我们提供了理解AI如何早期采用的宝贵窗口。报告揭示了AI应用在不同地区、行业和用户群体中的显著差异,以及这些差异背后的经济和社会因素。随着AI技术的不断发展和用户信任度的提高,我们可以预见AI将对全球经济和工作方式产生深远影响。
然而,这种影响可能是不均衡的,政策制定者、企业和个人都需要做好准备,确保AI带来的利益能够广泛分享,同时减轻可能的风险。通过持续的研究和数据分享,我们可以更好地理解AI的经济影响,为未来的技术变革做好准备。