ChatGPT隐私危机:私密对话泄露至Google分析工具

1

意外泄露:私密对话现身Google监控工具

近期,一项令人震惊的隐私泄露事件引发了广泛关注:大量用户的ChatGPT私密对话意外出现在Google Search Console(GSC)这一通常用于监控网站搜索流量的工具中。这一异常现象自9月开始被注意到,当网站管理员查看GSC性能报告时,除了常规的关键词或短查询外,还发现了长度超过300字符的异常查询。

这些查询仅显示用户输入,内容涉及关系问题、商业机密等高度敏感信息。据分析,这些对话来自那些期望其交流保持私密性的用户,他们使用ChatGPT帮助解决各种问题,却未料到这些对话会出现在Google的网站管理工具中。

专家调查:揭示OpenAI可能的数据收集行为

Jason Packer,一家名为Quantable的分析咨询公司负责人,是首位详细记录这一问题的人。他在上月发布的一篇博客中详细描述了这一现象。随后,他与网络优化顾问兼"网络侦探"Slobodan Manić合作,进行了一系列测试,认为这可能"首次提供了OpenAI直接使用实际用户提示抓取Google搜索的确凿证据"。

他们的研究似乎证实,这家AI巨头正在以牺牲用户隐私为代价,通过获取Google本不会分享的搜索数据来维持用户参与度。

OpenAI拒绝确认Packer和Manić的理论是否正确,也不愿回答可能帮助用户了解问题范围的其他问题。然而,一位OpenAI发言人确认,公司已"意识到"这一问题,并已"解决"了一个"暂时影响少量搜索查询路由"的故障。

泄露内容:从恋爱关系到商业机密

Packer审查的第一个异常ChatGPT查询来自一位可能女性用户的意识流,她要求ChatGPT评估某些行为,以帮助她判断一个经常取笑她的男孩是否对她有好感。另一个异常查询似乎来自一位办公室经理,他在分享商业信息的同时,策划返回办公室的公告。

这些只是Packer在一个网站上审查的200多个异常查询中的两个。他告诉Ars,其中包含"一些相当疯狂的"查询。在他的博客中,Packer总结认为这些查询应该作为"提醒:提示并不像你认为的那样私密!"

Packer怀疑这些查询与8月份The Information的报道有关,该报道援引消息人士称,OpenAI正在抓取Google搜索结果来支持ChatGPT的回应。消息人士称,OpenAI依赖Google来回答关于当前事件(如新闻或体育)的ChatGPT提示。

技术分析:泄露路径与漏洞机制

Manić帮助Packer解决了这一谜题的大部分。他发现,异常查询出现在某个网站的GSC中,是因为该网站在Google搜索中针对"https://openai.com/index/chatgpt/"排名很高——这是每个出现在GSC中的奇怪查询开头附加的ChatGPT URL。

Google似乎对该URL进行了分词处理,将其分解为"openai + index + chatgpt"等关键词的搜索。Parker和Manić推测,因此在这些关键词上排名较高的使用GSC的网站很可能会遇到ChatGPT泄露,包括那些报道先前ChatGPT泄露(聊天被索引在Google搜索结果中)的网站。

"不要混淆,这是一个新的、完全不同的ChatGPT失误,不同于让Google索引我们不希望他们索引的内容,"Packer写道。"如果说有什么不同,那就是更奇怪,尽管不那么严重。"

OpenAI具体修复了什么尚不清楚,但Packer和Manić对泄露聊天的一个可能路径有理论。他们发现,访问GSC中发现的每个奇怪查询开头的URL,ChatGPT用户会遇到一个似乎有问题的提示框,导致"该页面的URL被添加到提示中"。

他们解释说,问题似乎在于:

通常,ChatGPT 5会在认为需要时选择进行网络搜索,对于需要专业知识或最新信息的搜索,更可能这样做。但这个有问题的提示框还包含查询参数'hints=search',使其基本上总是进行搜索:https://chatgpt.com/?hints=search&openaicom_referred=true&model=gpt-5

Packer的博客明确指出,其中一些搜索依赖Google,错误地将用户在提示框中说的任何内容发送到GSC,并在前面添加了"https://openai.com/index/chatgpt/"文本。正如Packer解释的那样:"我们知道它一定是抓取了这些内容,而不是使用API或某种私人连接——因为其他选项不会显示在GSC中。"

这意味着"OpenAI将与Google搜索相关的任何提示分享给Google、进行抓取的人,以及出现在搜索结果中的任何网站!哎呀。"

在Packer看来,过去两个月内,"所有使用Google搜索的ChatGPT提示"都有被泄露的风险。

OpenAI回应:模糊不清的解决方案

OpenAI声称只有少量查询被泄露,但拒绝提供更精确的估计。因此,每周使用ChatGPT的7亿用户中有多少提示被路由到GSC仍不清楚。

在8月ChatGPT提示被发现出现在Google搜索索引中后,OpenAI澄清说用户点击了一个框使这些提示公开,OpenAI辩称这"足够明确"。在很明显用户感到被误导而公开分享私人聊天后,这家AI公司后来急忙从Google的SERP中删除了这些聊天。

Packer告诉Ars,先前泄露和GSC泄露之间的一个主要区别是,受先前丑闻影响的用户至少在某种程度上"必须主动分享"他们的泄露聊天。在最近的情况下,"没有人点击分享"或有任何合理的方法防止他们的聊天被暴露。

"OpenAI是不是走得如此之快以至于没有考虑这对隐私的影响,还是他们根本不在乎?"Packer在他的博客中假设。

对一些用户来说,最令人担忧的是——除非他们的提示可能包含识别信息,否则他们的身份不会在聊天中 linked——似乎没有办法从GSC中删除泄露的聊天,这与先前的丑闻不同。

Packer和Manić对OpenAI的修复能在多大程度上阻止这一问题仍有"悬而未决的问题"。

Manić希望OpenAI可能会确认在https://chatgpt.com/上输入的触发Google搜索的提示是否也受到了影响。但OpenAI没有跟进这个问题,也没有回答关于泄露范围更广泛的问题。对Manić来说,一个主要担忧是OpenAI的抓取可能正在"导致Google Search Console中的'鳄鱼嘴'",这是一个SEO研究人员标记的令人担忧的趋势,它导致展示量激增但点击量下降。

OpenAI也没有澄清Packer最大的问题。他仍然想知道公司的"修复"是否只是停止了OpenAI的"搜索查询路由,使得原始提示不再发送到Google搜索,或者他们是否完全停止抓取Google搜索以获取数据?"

"我们仍然不知道是那个特定的页面有这个bug,还是这真的非常普遍,"Packer告诉Ars。"在任何情况下,这都是严重的,只是显示了OpenAI在隐私方面多么不谨慎地行事。"

行业影响:AI隐私保护的新挑战

这一事件不仅仅是一次技术故障,它揭示了AI行业在快速发展过程中对隐私保护的系统性忽视。随着人工智能服务越来越深入人们的生活,如何平衡技术创新与用户隐私已成为一个亟待解决的问题。

OpenAI作为AI领域的领先企业,其行为对整个行业具有示范效应。此次事件表明,即使是最先进的AI公司也可能在数据处理方面存在严重漏洞,且对用户隐私保护不够重视。这种状况可能会引发监管机构对AI数据收集实践的更严格审查。

对于用户而言,这一事件敲响了警钟:在使用AI服务时,不应假设所有对话都是完全私密的。用户需要更加谨慎地处理敏感信息,并了解AI服务的隐私政策和工作原理。

未来展望:AI伦理与数据保护的平衡

随着AI技术的不断进步,如何在创新与隐私保护之间找到平衡将成为行业面临的重要挑战。此次ChatGPT隐私泄露事件可能会促使AI公司重新审视其数据处理流程,加强隐私保护措施,提高透明度。

监管机构也可能加强对AI数据收集实践的监管,要求AI公司更加明确地告知用户其数据如何被使用,并提供更好的控制选项。同时,技术解决方案,如更安全的提示处理和更严格的数据访问控制,也将成为未来AI系统设计的重要组成部分。

最终,这一事件提醒我们,在享受AI技术带来便利的同时,我们也需要保持警惕,确保技术发展不会以牺牲基本隐私权为代价。只有当AI公司在追求创新的同时真正重视用户隐私,才能建立可持续发展的技术生态系统。