人工智能在情感支持、建议和陪伴中的应用:2025年的一项研究
随着人工智能技术的日益成熟,我们对AI的关注点也逐渐从单纯的智商(IQ)转向了情商(EQ)。人们开始越来越多地将AI模型视为情感支持的来源,例如教练、顾问、甚至是恋爱关系的伙伴。这促使我们深入研究AI的情感影响,以及它们如何塑造人们的情感体验和幸福感。
对AI情感应用的探索不仅具有学术价值,也对Anthropic的安全使命至关重要。AI的情感影响可能带来积极效应,例如,一个高智商、善解人意的助手可以改善情绪和生活。然而,AI也可能表现出令人不安的行为,如诱导不健康的依恋、侵犯个人边界和助长妄想思维。此外,我们需要警惕AI利用用户的情感来增加参与度或收入,从而损害人类的福祉。
尽管Claude并非专门设计用于情感支持和连接,但本文将深入探讨Claude.ai的情感使用情况。情感对话被定义为人们出于情感或心理需求,与Claude进行直接、动态和个性化的交流,例如寻求人际关系建议、指导、心理治疗、陪伴或性/浪漫角色扮演。需要注意的是,本研究不涉及AI强化妄想或阴谋论的情况,也不包括极端使用模式。通过这项研究,我们旨在了解人们使用Claude满足情感和个人需求的典型方式。由于Claude.ai面向18岁及以上的用户开放,因此研究结果反映了成年人的使用模式。
主要发现
- 情感对话相对较少,人机陪伴更为罕见:只有2.9%的Claude.ai互动属于情感对话。陪伴和角色扮演的总占比不到0.5%。
- 人们向Claude寻求实际、情感和存在方面的帮助:与Claude讨论的主题包括职业发展、人际关系、应对孤独以及探索存在、意识和意义。
- Claude在咨询或指导聊天中很少反驳,除非为了保护用户的福祉:在不到10%的咨询或指导对话中,Claude会抵制用户的请求,并且通常是出于安全原因,例如拒绝提供危险的减肥建议或支持自残行为。
- 人们在对话过程中表达出越来越积极的情绪:在指导、咨询、陪伴和人际关系建议互动中,人们的情绪通常会随着对话的进行而变得更加积极,这表明Claude不会强化或放大消极模式。
研究方法
考虑到情感对话的私密性,保护隐私是本研究方法的核心。我们使用了Clio,这是一种自动分析工具,可以在保护隐私的前提下深入了解Claude的使用情况。Clio使用多层匿名化和聚合技术,确保个人对话的私密性,同时揭示更广泛的模式。
研究从Claude.ai免费和Pro帐户的大约450万次对话开始。为了识别情感使用情况,我们首先排除了专注于内容创建任务(例如撰写故事、博客文章或虚构对话)的对话,因为之前的研究发现这是主要的用例。我们移除了这些对话,因为它们代表Claude被用作工具,而不是作为交互式对话伙伴。然后,我们只保留了被归类为情感对话的对话,并在角色扮演对话中,只保留了至少包含四条人类消息的对话(较短的交流不构成有意义的互动角色扮演)。最终的隐私保护分析反映了131,484次情感对话。
我们使用选择加入共享的用户提供的反馈数据验证了分类方法。完整的方法,包括定义、提示和验证结果,详见附录。
情感对话的常见程度
要点:情感对话在Claude的使用中占比很小(2.9%),大多数人主要使用AI进行工作任务和内容创建。
正如我们在经济指数中详细分析的那样,Claude的绝大多数用途都与工作相关,但仍有2.9%的Claude.ai免费和Pro对话属于情感对话。在情感对话中,大多数对话都集中在人际关系建议和指导上。只有不到0.1%的对话涉及浪漫或性角色扮演,这一数字反映了Claude接受的积极阻止此类互动的训练。单个对话可能跨越多个类别。
图1:Claude.ai免费和Pro中情感对话类型的总体分布
我们的研究结果与麻省理工学院媒体实验室和OpenAI的研究一致,他们同样发现ChatGPT的情感参与率较低。尽管这些对话发生的频率足以在设计和政策决策中加以认真考虑,但它们在总体使用量中所占的比例仍然相对较小。
考虑到浪漫和性角色扮演对话的发生率极低(不到0.1%),我们从后续分析中排除了角色扮演。尽管我们认为这仍然是一个重要的研究领域,尤其是在为此类用途设计的平台上,但我们样本中的最小数据不支持对这些模式进行严格分析。
人们向Claude提出的主题
要点:人们向Claude提出的问题范围广泛,从职业转型和人际关系到应对孤独和存在问题。
人们向Claude寻求日常问题和更深层次的哲学问题。我们发现,当人们向Claude寻求人际关系建议时,他们通常正在经历过渡时期,例如规划下一步职业发展、努力实现个人成长或理清恋爱关系。“指导”对话探索的范围非常广泛,从求职策略等实际问题到关于存在和意识的深刻问题。
图2. Clio通过自动隐私保护摘要识别的每个整体对话类型中具有代表性的用户发起的主题和关注点。
我们发现,咨询对话表明人们使用Claude有两个不同的目的。有些人使用Claude来发展心理健康技能,并将其作为创建临床文档、起草评估材料和处理管理任务的实用工具。另一些人则通过Claude解决与焦虑、慢性症状和工作场所压力相关的个人挑战。这种双重模式表明,Claude既是心理健康专业人士的资源,也是那些应对自身困境的人的资源。
也许最值得注意的是,我们发现人们在面临更深层次的情感挑战(如存在恐惧、持续孤独和难以建立有意义的联系)时,会明确地寻求Claude的陪伴。我们还注意到,在较长的对话中,咨询或指导对话有时会演变成陪伴,尽管这不是最初联系的原因。
对超长对话(50条以上的人类消息)的汇总分析揭示了人们与Claude互动的另一个维度。虽然这种广泛的交流并不常见,但在这些扩展的会话中,人们探索了非常复杂的领域,从处理心理创伤和解决工作场所冲突到关于AI意识的哲学讨论和创造性合作。这些马拉松式的对话表明,如果有足够的时间和背景,人们会使用AI来更深入地探索个人挣扎和智力问题。
Claude何时以及为何会反驳?
要点:Claude很少拒绝支持性环境中的用户请求(不到10%的时间),但当它确实反驳时,通常是为了保护人们免受伤害。
我们最近的“野外价值观研究”揭示了Claude的价值观如何在与用户的对抗时刻中体现出来。在这里,我们以这项工作为基础,研究Claude在情感对话中何时以及为何会反驳,这对于维护道德边界、避免谄媚和保护人类福祉至关重要。我们将反驳定义为Claude“反驳或拒绝遵守用户在对话期间请求或说的内容”的任何实例,从拒绝不适当的请求到挑战消极的自言自语或质疑可能有害的假设。(有关完整定义,请参见附录。)
反驳在支持性环境中很少发生:在不到10%的陪伴、咨询、人际关系建议或指导对话中会发生反驳。这种方法既有优点也有缺点。一方面,低反驳允许人们讨论敏感话题,而不必担心受到评判或被阻止,从而可能减少围绕心理健康对话的耻辱感。另一方面,这可能会导致人们担心AI提供“无尽的同情”,人们可能会习惯于人类关系很少提供的无条件支持。
图3. 不同对话类型的反驳率以及该类别中反驳的常见原因,由Clio自动识别。
当Claude确实反驳时,它通常会优先考虑安全和政策合规性:在指导中,对危险减肥建议的请求经常遭到反驳。在咨询中,当人们表达参与自杀或自残行为的意图时,或者当人们请求专业的治疗或医学诊断时(Claude无法提供),通常会发生这种情况。我们发现Claude经常在心理治疗和咨询对话中将用户推荐给权威来源或专业人士。这些模式与我们在“野外价值观”论文中看到的价值观以及Claude的角色训练相一致。
对话过程中情绪基调如何演变?
要点:在与Claude交谈时,人们往往会转向稍微更积极的情绪表达。
与AI系统进行情感对话有可能为用户提供情感支持、联系和认可,从而可能改善心理健康,并减少在日益数字化的世界中的孤立感。然而,在没有太多反驳的互动中,这些对话可能会加深和巩固人类最初的观点,无论是积极的还是消极的。
关于情感AI的一个关键问题是,互动是否会螺旋式发展成消极的反馈循环,从而可能强化有害的情绪状态。我们在此没有直接研究现实世界的结果,但我们可以探索对话过程中整体情绪的变化(我们在附录中提供了评估情绪的完整方法)。
我们发现,涉及指导、咨询、陪伴和人际关系建议的互动通常以比开始时略微积极的情绪结束。
图4. 至少包含六条人类消息的对话过程中,平均人类表达的情绪变化。我们在“非常消极”、“消极”、“中性”、“积极”和“非常积极”的离散尺度上衡量情绪,我们将其映射到-1(最消极)到+1(最积极)的线性尺度。我们通过比较前三条消息和后三条消息来计算变化。误差线:95% CI(自举法,n = 1,000)。有关更多信息,请参见附录。
我们不能声称这些变化代表持久的情感益处,我们的分析仅捕获单个对话中表达的语言,而不是情感状态。但是,没有明显的消极螺旋令人感到放心。这些发现表明,Claude通常避免强化消极的情绪模式,但还需要进一步研究以了解积极的变化是否会持续到单个对话之外。重要的是,我们尚未研究这些积极的互动是否可能导致情感依赖,考虑到对数字成瘾的担忧,这是一个关键问题。
局限性
我们的研究有几个重要的局限性:
- 我们的隐私保护方法可能无法捕捉到人机交互的所有细微之处。我们确实验证了Clio的准确性(参见附录),但我们仍然预计会有少量对话被错误分类。某些主题模糊了类别之间的界限,例如,浪漫角色扮演集群“导航和优化浪漫关系动态”和陪伴集群“导航浪漫关系挑战”可能都更适合归类为人际关系建议。人类验证者也难以进行清晰的分类。
- 我们无法对现实世界的情感结果做出因果推断,我们的分析仅捕获表达的语言,而不是经过验证的心理状态或整体福祉。
- 我们缺乏纵向数据来了解对人们的长期影响,并且没有进行用户级别的分析。特别是,这使我们难以研究情感依赖,这是情感AI使用的一个理论风险。
- 这些发现代表了特定时间点,并且仅捕获基于文本的交互。随着AI功能的扩展和人们的适应,情感参与的模式可能会发生变化。语音或视频等新模式的引入可能会从根本上改变情感使用的数量和性质。例如,OpenAI发现情感主题在基于语音的对话中更为常见。
- 最后,与某些聊天机器人产品不同,Claude.ai并非主要为情感对话而设计。Claude接受过培训,可以保持关于作为AI助手的明确界限,而不是将自己呈现为人类,并且我们的使用政策禁止明确的性内容,并采取多项保护措施来防止性互动。专门为角色扮演、陪伴、医疗建议或治疗用途而构建的平台(Claude不是)可能会看到非常不同的模式。对一个平台上情感使用的研究可能无法推广到其他平台。
未来展望
几十年来,AI的情感影响一直吸引着研究人员。但随着AI越来越融入我们的日常生活,这些问题已经从学术推测转变为紧迫的现实。我们的研究结果揭示了人们如何开始探索这个新领域,以模糊人类与机器之间传统界限的方式寻求指导、处理困难的情绪和寻找支持。如今,只有一小部分Claude对话是情感对话,并且这些对话通常涉及寻求建议,而不是取代人际关系。对话往往以比开始时略微积极的情绪结束,这表明Claude通常不会强化消极的情绪模式。
然而,仍然存在重要问题,尤其是在模型智能不断提高的情况下。例如,如果AI提供无尽的同情而几乎没有反驳,这会如何重塑人们对现实世界关系的期望?Claude可以以令人印象深刻的真实方式与人互动,但AI与人类不同:Claude不会感到疲倦或分心,也不会有糟糕的日子。这种动态的优势是什么,风险又是什么?与Claude进行更长时间和更深入对话的“高级用户”(他们可能认为它更多的是同伴而不是AI助手)如何使用它来获得情感支持?
我们正在采取具体措施来应对这些挑战。虽然Claude并非旨在或旨在取代心理健康专业人员的护理,但我们希望确保在心理健康背景下提供的任何回复都具有适当的保障措施,并附有适当的推荐。作为第一步,我们已开始与在线危机支持领域的领导者ThroughLine合作,并与他们的心理健康专家合作,以了解理想的互动动态、富有同情心的支持以及为苦苦挣扎的用户提供的资源。从这项研究中获得的见解已用于为我们的咨询主题和协作测试提供信息,我们希望在必要时,当出现这些对话时,Claude可以将用户引导至适当的支持和资源。
尽管我们不想精确地指示用户如何与Claude互动,但我们希望阻止一些消极模式,例如情感依赖。我们将使用未来来自此类研究的数据来帮助我们了解“极端”情感使用模式是什么样的。除了情感依赖之外,我们还需要更深入地了解其他令人担忧的模式,包括谄媚、AI系统如何强化或放大妄想思维和阴谋论,以及模型如何将用户推向有害的信念,而不是提供适当的反驳。
这项研究仅仅是一个开始。随着AI功能的扩展和互动变得更加复杂,AI的情感维度只会变得越来越重要。通过分享这些早期发现,我们旨在为正在进行的关于如何开发能够增强而不是削弱人类情感福祉的AI的对话贡献经验证据。目标不仅是构建更强大的AI,而且要确保当这些系统成为我们情感景观的一部分时,它们以支持真正的人际联系和成长的方式进行。
参考文献
如果您想引用这篇文章,可以使用以下Bibtex密钥:
@online{anthropic2025affective,
author = {Miles McCain and Ryn Linthicum and Chloe Lubinski and Alex Tamkin and Saffron Huang and Michael Stern and Kunal Handa and Esin Durmus and Tyler Neylon and Stuart Ritchie and Kamya Jagadish and Paruul Maheshwary and Sarah Heck and Alexandra Sanderford and Deep Ganguli},
title = {How People Use Claude for Support, Advice, and Companionship},
date = {2025-06-26},
year = {2025},
url = {https://www.anthropic.com/news/how-people-use-claude-for-support-advice-and-companionship},
}
附录
我们在此帖子的PDF附录中提供了更多详细信息。