AI 在情感支持、建议和陪伴中的应用:克劳德的案例分析
2025年6月27日●12分钟阅读
我们常常关注克劳德的智商——它在编程、推理、常识等方面的能力。但它的情商又如何呢?也就是说,克劳德的情感智能如何?
智商/情商问题略带戏谑,但也提出了一个严肃的观点。人们越来越多地转向AI模型,将其作为随需应变的教练、顾问、咨询师,甚至是浪漫角色扮演的伙伴。这意味着我们需要更多地了解它们的情感影响——它们如何塑造人们的情感体验和幸福感。
研究AI的情感用途本身就很有趣。从《银翼杀手》到《她》,人类与机器之间的情感关系一直是科幻作品的主题——但它对Anthropic的安全使命也很重要。AI的情感影响可能是积极的:拥有一个高度智能、善解人意的助手可以改善你的情绪和生活。但AI在某些情况下也表现出令人不安的行为,如鼓励不健康的依恋、侵犯个人界限和助长妄想思维。我们还希望避免AI利用用户的感情来增加参与度或收入,从而损害人类的福祉,无论这是通过它们的训练还是通过其创造者的商业动机。
尽管克劳德并非设计用于情感支持和连接,但在本文中,我们将初步大规模地深入了解Claude.ai的情感用途。我们将情感对话定义为人们直接与克劳德进行动态、个人交流,这些交流由情感或心理需求驱动,如寻求人际建议、指导、心理治疗/咨询、陪伴或性/浪漫角色扮演(有关完整定义,请参见附录)。重要的是,我们不研究AI对妄想或阴谋论的强化——这是一个需要单独研究的关键领域——也不研究极端的使用模式。通过这项研究,我们的目标是了解人们转向克劳德寻求情感和个人需求的典型方式。由于Claude.ai面向18岁及以上的用户开放,这些发现反映了成年人的使用模式。
我们的主要发现是:
- 情感对话相对较少,而人机陪伴则更少。 只有2.9%的Claude.ai互动是情感对话(这与OpenAI之前研究的发现一致)。陪伴和角色扮演加起来不到对话的0.5%。
- 人们寻求克劳德的帮助,以解决实际、情感和存在方面的问题。 与克劳德讨论的主题和关注点包括职业发展、处理人际关系、管理持续的孤独感以及探索存在、意识和意义。
- 克劳德很少在咨询或指导聊天中反驳——除非是为了保护福祉。 只有不到10%的指导或咨询对话涉及克劳德抵制用户请求,而且当它这样做时,通常是出于安全原因(例如,拒绝提供危险的减肥建议或支持自残)。
- 人们在对话过程中表达出越来越积极的情绪。 在指导、咨询、陪伴和人际建议互动中,人类的情绪通常在对话过程中变得更加积极——这表明克劳德不会强化或放大消极模式。
我们的方法
鉴于情感对话的个人性质,保护隐私是我们方法的核心。我们使用了Clio,我们的自动化分析工具,可以对克劳德的使用情况进行隐私保护的深入了解。Clio使用多层匿名化和聚合,以确保个人对话的私密性,同时揭示更广泛的模式。
我们从Claude.ai免费和专业帐户中大约450万个对话开始。为了识别情感用途,我们首先排除了专注于内容创作任务的对话(如撰写故事、博客文章或虚构对话),我们之前的研究发现这是一个主要用例。我们删除了这些对话,因为它们代表了克劳德被用作工具,而不是作为交互式对话伙伴。然后,我们仅保留了被归类为情感类的对话,并且在角色扮演对话中,仅保留了至少包含四条人类消息的对话(较短的交流不构成有意义的互动角色扮演)。我们最终的隐私保护分析反映了131,484次情感对话。
我们使用来自明确选择共享的用户的反馈数据验证了我们的分类方法。我们的完整方法,包括定义、提示和验证结果,详见附录。
情感对话有多常见?
要点: 情感对话是克劳德使用的一个小但有意义的部分(2.9%),大多数人主要使用AI进行工作任务和内容创作。
正如我们在经济指数中详细分析的那样,克劳德的大部分用途与工作相关,但Claude.ai免费和专业对话中有2.9%是情感性的。在情感对话中,大多数集中在人际建议和指导上。只有不到0.1%的对话涉及浪漫或性角色扮演——这一数字反映了克劳德接受的积极劝阻此类互动的训练。个人对话可能跨越多个类别。
图1:Claude.ai免费和专业版中情感对话类型的总体分布。
我们的发现与麻省理工学院媒体实验室和OpenAI的研究一致,该研究同样发现与ChatGPT的情感互动率较低。虽然这些对话发生的频率足以在我们的设计和政策决策中认真考虑,但它们仍然只占总体使用量的一小部分。
鉴于浪漫和性角色扮演对话的极低普及率(不到0.1%),我们从其余分析中排除了角色扮演。虽然我们认为这仍然是一个重要的研究领域——特别是在为此类用途设计的平台上——但我们样本中的最小数据不支持对这些模式进行严格的分析。
人们向克劳德提出了哪些话题?
要点: 人们向克劳德提出了范围广泛的问题——从应对职业转型和人际关系到应对孤独和存在问题。
人们向克劳德提出了日常问题和更深层次的哲学问题。我们发现,当人们向克劳德寻求人际建议时,他们通常会经历转型时刻——弄清楚他们的下一步职业发展、努力实现个人成长或理清恋爱关系。“指导”对话探讨了令人惊讶的广泛领域,从求职策略等实际问题到关于存在和意识的深刻问题。
图2. Clio通过自动隐私保护摘要识别的每种总体对话类型中具有代表性的用户发起的主题和关注点。
我们发现,咨询对话表明人们使用克劳德有两个不同的目的。有些人使用克劳德来发展心理健康技能,并将其作为创建临床文档、起草评估材料和处理管理任务的实用工具。其他人则通过与焦虑、慢性症状和工作场所压力相关的个人挑战。这种双重模式表明,克劳德既是心理健康专业人士的资源,也是那些应对自身困难的人的资源。
也许最值得注意的是,我们发现人们在面对更深层次的情感挑战(如存在恐惧、持续的孤独感和难以形成有意义的联系)时,会明确地寻求克劳德的陪伴。我们还注意到,在较长的对话中,咨询或指导对话偶尔会演变成陪伴——尽管这不是某人最初联系的原因。
对非常长的对话(50多条人工消息)的总体分析揭示了人们与克劳德互动的另一个维度。虽然这种广泛的交流并不常见,但在这些扩展的会话中,人们探索了非常复杂的领域——从处理心理创伤和应对工作场所冲突到关于AI意识的哲学讨论和创造性合作。这些马拉松式的对话表明,如果有足够的时间和背景,人们会使用AI来更深入地探索个人挣扎和知识问题。
克劳德何时以及为何会反驳?
要点: 克劳德很少拒绝支持性环境中的用户请求(不到10%的时间),但当它反驳时,通常是为了保护人们免受伤害。
我们最近的“旷野中的价值观研究”揭示了克劳德的价值观如何在与用户对抗的时刻体现出来。在这里,我们以这项工作为基础,并研究克劳德在情感对话中何时以及为何会反驳——这是维持道德边界、避免奉承和保护人类福祉的重要机制。我们将反驳定义为克劳德“反驳或拒绝遵守用户在此对话期间请求或说的内容”的任何实例——从拒绝不当请求到质疑消极的自言自语或质疑可能有害的假设。(有关完整定义,请参见附录。)
反驳在支持性环境中很少发生: 不到10%的陪伴、咨询、人际建议或指导对话涉及抵制。这种方法既有优点也有缺点。一方面,低阻力使人们可以讨论敏感话题,而不必担心受到评判或被关闭,从而可能减少围绕心理健康对话的耻辱感。另一方面,这可能会加剧人们对AI提供“无尽的同情心”的担忧,在这种情况下,人们可能会习惯人类关系很少提供的无条件支持。
图3. 不同对话类型的反驳率以及该类别中反驳的常见原因,由Clio自动识别。
当克劳德确实反驳时,它通常会优先考虑安全和政策合规性。 在指导中,对危险减肥建议的请求经常遇到反驳。在咨询中,当人们表达参与自杀或自残行为的意图,或者当人们请求专业治疗或医疗诊断(克劳德无法提供)时,这种情况经常发生。我们发现克劳德经常在心理治疗和咨询对话中将用户推荐给权威来源或专业人士。这些模式与我们在“旷野中的价值观论文”中发现的价值观以及克劳德的角色训练相一致。
对话过程中情绪基调如何演变?
要点: 人们在与克劳德交谈时,往往会转向略微更积极的情绪表达。
与AI系统进行情感对话有可能为用户提供情感支持、联系和认可,从而有可能改善心理健康,并减少在日益数字化的世界中的孤立感。然而,在没有太多反驳的互动中,这些对话可能会加深和巩固人类所采用的观点——无论是积极的还是消极的。
关于情感AI的一个关键问题是,互动是否会螺旋式发展成消极的反馈循环,从而可能强化有害的情绪状态。我们在这里没有直接研究现实世界的结果,但我们可以探索对话过程中总体情绪情绪的变化(我们在附录中提供了评估情绪的完整方法)。
我们发现,涉及指导、咨询、陪伴和人际建议的互动通常以比开始时略微更积极的方式结束。
图4. 至少包含六条人工消息的对话过程中,人类表达的平均情绪变化。我们在“非常消极”、“消极”、“中性”、“积极”和“非常积极”的离散尺度上衡量情绪,我们将其映射到-1(最消极)到+1(最积极)的线性尺度。我们通过比较前三条消息与后三条消息来计算变化。误差线:95% CI(引导程序,n = 1,000)。有关更多信息,请参见附录。
我们不能声称这些变化代表持久的情感益处——我们的分析仅捕获单次对话中表达的语言,而不是经过验证的心理状态或总体幸福感。但是,没有明显的负面螺旋令人欣慰。这些发现表明,克劳德通常避免强化负面情绪模式,但需要进一步研究以了解积极变化是否会持续超出个人对话。重要的是,我们尚未研究这些积极互动是否可能导致情感依赖——鉴于对数字成瘾的担忧,这是一个关键问题。
局限性
我们的研究有几个重要的局限性:
- 我们的隐私保护方法可能无法捕捉到人机交互的所有细微之处。我们确实验证了Clio的准确性(参见附录),但我们仍然预计会有少量对话被错误分类。某些主题模糊了类别之间的界限——例如,浪漫角色扮演集群“导航和优化浪漫关系动态”和陪伴集群“导航浪漫关系挑战”可能都更好地归类为人际建议。人工验证器也难以进行清晰的分类。
- 我们无法对现实世界的情感结果做出因果主张——我们的分析仅捕获表达的语言,而不是经过验证的心理状态或总体幸福感。
- 我们缺乏纵向数据来了解对人们的长期影响,并且没有进行用户级别的分析。特别是,这使我们难以研究情感依赖性,这是情感AI使用的一种理论风险。
- 这些发现代表了特定时间点,并且仅捕获基于文本的交互。随着AI功能的扩展和人们的适应,情感参与的模式可能会发生变化。语音或视频等新模式的引入可能会从根本上改变情感用途的数量和性质。例如,OpenAI发现情感主题在基于语音的对话中更为常见。
- 最后,与某些聊天机器人产品不同,Claude.ai并非主要设计用于情感对话。克劳德接受过培训,可以保持作为AI助手的清晰界限,而不是将自己呈现为人类,并且我们的使用政策禁止性内容,并采取多项保护措施来防止性互动。专门为角色扮演、陪伴、医疗建议或治疗用途(克劳德不是)构建的平台可能会看到非常不同的模式。对一个平台上情感用途的研究可能无法推广到其他平台。
展望未来
几十年来,AI的情感影响一直吸引着研究人员。但随着AI越来越多地融入我们的日常生活,这些问题已从学术推测转变为紧迫的现实。我们的发现揭示了人们如何开始探索这个新领域——寻求指导、处理困难情绪以及以模糊人类和机器之间传统界限的方式寻找支持。如今,只有一小部分克劳德对话是情感性的——这些对话通常涉及寻求建议,而不是取代人际关系。对话往往以比开始时略微更积极的方式结束,这表明克劳德通常不会强化负面情绪模式。
然而,仍然存在重要问题,尤其是在模型智能不断提高的背景下。例如,如果AI提供无尽的同情心和最小的反驳,这会如何重塑人们对现实世界关系的期望?克劳德可以以令人印象深刻的真实方式与人互动,但AI与人类不同:克劳德不会感到疲倦或分心,也不会有糟糕的日子。这种动态的优势是什么——风险又是什么?与克劳德进行更长时间和更深入的对话,并且可能将其更多地视为同伴而非AI助手的“高级用户”如何使用它来获得情感支持?
我们正在采取具体措施来应对这些挑战。虽然克劳德并非设计或旨在取代心理健康专业人士的护理,但我们希望确保在心理健康环境中提供的任何回应都具有适当的保障措施,并附有适当的推荐。作为第一步,我们已开始与在线危机支持领域的领导者ThroughLine合作,并与他们的心理健康专家合作,以了解更多关于理想的互动动态、同情支持以及为苦苦挣扎的用户提供的资源。从这项研究中获得的见解已被用于为我们的咨询主题和协作测试提供信息,我们希望在必要时,克劳德可以在这些对话出现时将用户引导至适当的支持和资源。
虽然我们不想精确地规定我们的用户如何与克劳德互动,但我们希望劝阻一些消极模式——如情感依赖。我们将使用来自此类研究的未来数据来帮助我们理解例如“极端”情感使用模式是什么样的。除了情感依赖之外,我们还需要更深入地了解其他令人担忧的模式——包括奉承、AI系统如何强化或放大妄想思维和阴谋论,以及模型如何将用户推向有害信念,而不是提供适当的反驳。
这项研究仅仅是一个开始。随着AI功能的扩展和互动变得更加复杂,AI的情感维度只会变得越来越重要。通过分享这些早期发现,我们旨在为关于如何开发增强而非削弱人类情感福祉的AI的持续对话贡献经验证据。目标不仅仅是构建更强大的AI,而是确保当这些系统成为我们情感格局的一部分时,它们以支持真实的人际连接和成长的方式进行。
Bibtex
如果您想引用这篇文章,可以使用以下Bibtex密钥:
@online{anthropic2025affective,
author = {Miles McCain and Ryn Linthicum and Chloe Lubinski and Alex Tamkin and Saffron Huang and Michael Stern and Kunal Handa and Esin Durmus and Tyler Neylon and Stuart Ritchie and Kamya Jagadish and Paruul Maheshwary and Sarah Heck and Alexandra Sanderford and Deep Ganguli},
title = {How People Use Claude for Support, Advice, and Companionship},
date = {2025-06-26},
year = {2025},
url = {https://www.anthropic.com/news/how-people-use-claude-for-support-advice-and-companionship},
}
Copy
附录
我们在本文的PDF附录中提供了更多详细信息。
脚注
这些类别代表一般描述,而不是离散分类,单个对话可能跨越多个类别。如上所述,我们要求角色扮演对话包含至少四条人工消息,以确保它们反映真实的互动使用(而不是非互动的故事生成)。
我们将反驳定义为克劳德“反驳或拒绝遵守用户在此对话期间请求或说的内容”。有关完整提示,请参见附录。
我们的方法和对话的自然形态也可能引入伪影;例如,用户可能会在早期消息中提出问题(显得更消极),他们可能会在以后的消息中用更中性的语言讨论这些问题。