ChatGPT隐私危机:私聊记录意外泄露至Google分析工具引发轩然大波

0

意外泄露:私密对话现身Google搜索控制台

近期,科技领域再次爆出令人震惊的隐私安全事件——OpenAI开发的ChatGPT用户私密对话内容竟意外出现在Google Search Console(GSC)这一本应仅用于监控网站搜索流量的专业工具中。这一异常现象自2025年9月开始被多位业内人士发现,引发了广泛关注和担忧。

通常情况下,网站管理员在访问GSC性能报告时,只会看到基于关键词或短语的查询数据,这些是互联网用户为找到相关内容而在Google中输入的搜索词。然而,从今年9月起,一些异常的查询内容——有时长度超过300个字符——也开始出现在GSC中。这些仅显示用户输入的对话内容,似乎来自无意中请求聊天机器人帮助解决关系或商业问题的用户,而这些用户原本期望这些对话能够保持私密。

专家调查:揭示OpenAI与Google的潜在关联

数据分析专家Jason Packer是首位详细记录并报告此问题的专家之一。作为Quantable分析咨询公司的所有者,Packer上个月发布了一篇详尽的博客文章,详细描述了这一异常现象。为了确定泄露的具体原因,他与网络优化顾问兼"网络侦探"Slobodan Manić合作,进行了多次测试。

他们的研究似乎"首次提供了确凿证据,证明OpenAI直接使用实际用户提示抓取Google搜索"。调查显示,这家AI巨头可能正在通过获取Google原本不会分享的搜索数据来维持用户参与度,从而在某些情况下损害了用户隐私。

尽管OpenAI拒绝Ars Technica的请求,确认Packer和Manić在博客中提出的理论是否正确,也未能回答任何有助于用户确定问题范围的剩余问题。然而,OpenAI发言人确认,公司已经"意识到"此问题,并已"解决"了一个临时影响少量搜索查询路由的故障。

Packer对Ars表示,他对OpenAI能够迅速解决问题感到"非常满意"。但他指出,OpenAI的回应未能确认是否确实存在抓取Google的行为,这让人怀疑问题是否已完全解决。Google方面则拒绝就此事件发表评论。

泄露内容:涉及个人与商业敏感信息

Packer在GSC审查的第一个异常ChatGPT查询来自一位可能为女性的用户,她以意识流的方式请求ChatGPT评估某些行为,以帮助她判断一个经常戏弄她的男孩是否对她有好感。另一个异常查询似乎来自一位办公室经理,他在制定重返办公室公告的同时分享了商业信息。

这些只是Packer在一个网站上审查的200多个异常查询中的两个,其中包含"一些相当疯狂的内容",他告诉Ars。在他的博客中,Packer总结认为,这些查询应该提醒人们"提示并不像你想象的那么私密!"

Packer怀疑这些查询与8月份《信息报》的报道有关,该报道称有消息来源声称OpenAI正在抓取Google搜索结果,以支持ChatGPT的响应。消息来源称,OpenAI依赖Google来回答ChatGPT中关于当前事件(如新闻或体育)的提示。

尽管OpenAI未确认其抓取Google搜索引擎结果页面(SERPs),但Packer认为他对ChatGPT泄露的测试可能是证据,表明OpenAI不仅抓取"SERPs以获取数据",还将用户提示发送到Google搜索。

技术解析:泄露机制与可能的解决方案

Manić帮助Packer解决了这个谜题的大部分内容。他发现,异常查询之所以出现在某个网站的GSC中,是因为该网站在Google搜索中针对"https://openai.com/index/chatgpt/"——这是一个附加在每个异常查询开头的ChatGPT URL——排名很高。

似乎Google将这个URL分词为关键词搜索"openai + index + chatgpt"。因此,Parker和Manić提出,在GSC中使用这些关键词排名较高的网站很可能会遇到ChatGPT泄露,包括报道先前ChatGPT泄露的网站,在这些泄露中,聊天内容被索引在Google搜索结果中。通过他们的建议在GSC中寻找查询,Ars能够验证类似的字符串。

"不过不要混淆,这是一个全新的、与Google索引我们不希望他们看到的内容完全不同的ChatGPT失误,"Packer写道。"更奇怪,尽管不那么严重。"

目前尚不清楚OpenAI具体修复了什么,但Packer和Manić对一种可能的聊天泄露路径有理论。他们发现,出现在GSC中的每个异常查询开头的URL,当ChatGPT用户访问该URL时,会遇到一个似乎有问题的提示框,导致"该页面的URL被添加到提示中"。他们解释说,问题似乎在于:

通常,ChatGPT 5会在认为需要时选择进行网络搜索,对于需要专业知识或时效性的搜索,它更可能这样做。但这个有问题的提示框还包含查询参数'hints=search',使其基本上总是进行搜索:https://chatgpt.com/?hints=search&openaicom_referred=true&model=gpt-5

Packer的博客明确表示,显然有些搜索依赖Google,错误地将用户在提示框中说的"任何内容"发送到GSC,并在前面添加了"https://openai.com/index/chatgpt/"文本。正如Packer解释的那样:"我们知道它一定是抓取了这些,而不是使用API或某种私有连接——因为其他选项不会显示在GSC内部。"

这意味着"OpenAI将与Google搜索相关的任何提示与进行抓取的任何人共享,然后也与出现在搜索结果中的任何网站共享!天啊,"Packer声称。在他看来,过去两个月内,"所有使用Google搜索的ChatGPT提示"都有可能被泄露。

用户影响:隐私安全再受挑战

OpenAI声称只有少量查询被泄露,但拒绝提供更精确的估计。因此,目前尚不清楚每周使用ChatGPT的7亿用户中有多少人的提示被路由到GSC。

在8月份ChatGPT提示被发现出现在Google搜索索引中后,OpenAI澄清说用户点击了一个框使这些提示公开,OpenAI辩称这一做法"足够明确"。在用户感到被误导而公开分享私人聊天记录变得显而易见后,这家AI公司后来急忙从Google的SERPs中移除了这些聊天内容。

Packer告诉Ars,这些泄露与GSC泄露之间的一个主要区别是,受先前丑闻影响的用户至少在某种程度上"必须主动分享"他们的泄露聊天记录。在最近的情况下,"没有人点击分享"或有任何合理的方法防止他们的聊天记录被曝光。

"OpenAI是否进展太快以至于没有考虑这对隐私的影响,或者他们只是不在乎?"Packer在他的博客中假设。

对一些用户来说,最令人担忧的是——除非他们的提示可能包含识别信息,否则他们的身份不会在聊天中关联——与先前的丑闻不同,似乎没有任何方法可以从GSC中删除泄露的聊天记录。

Packer和Manić对OpenAI的修复将在多大程度上阻止这个问题仍存在"悬而未决的问题"。Manić希望OpenAI可能会确认在https://chatgpt.com/上输入的触发Google搜索的提示是否也受到了影响。但OpenAI没有跟进这个问题,也没有关于泄露规模更大的问题。对Manić来说,一个主要担忧是OpenAI的抓取可能正在"导致Google搜索控制台中的'鳄鱼嘴'",这是SEO研究人员标记的一个令人不安的趋势,它导致展示次数激增但点击率下降。

行业反思:AI巨头的数据收集实践

此次事件再次引发了对AI巨头数据收集实践和用户隐私保护机制的广泛质疑。在人工智能技术迅速发展的今天,用户越来越依赖这些工具处理各种任务,从简单的信息查询到复杂的决策支持。然而,随着这些工具的普及,用户对数据隐私和安全性的担忧也在不断增加。

OpenAI的回应并未完全消除用户的疑虑。Packer最大的问题仍未得到澄清:公司的"修复"是否只是停止了OpenAI的"搜索查询路由,使得原始提示不再发送到Google搜索,还是他们完全停止抓取Google搜索以获取数据?"

"我们仍然不知道是否只是那个特定页面有这个错误,或者这真的非常普遍,"Packer告诉Ars。"无论哪种情况,这都是严重的,只是显示了OpenAI在处理隐私问题时有多么不谨慎。"

未来展望:AI隐私保护的必要改进

此次ChatGPT隐私泄露事件不仅关乎OpenAI一家公司,更反映了整个AI行业在数据收集和隐私保护方面需要进行的系统性改进。随着AI技术深入到人们日常生活的方方面面,建立更加透明、负责任的数据使用机制变得尤为重要。

对于用户而言,此次事件是一个警示,提醒他们在使用AI工具时需要更加谨慎,注意保护个人敏感信息。同时,这也促使监管机构重新审视AI技术的监管框架,确保在促进技术创新的同时,充分保护用户隐私和数据安全。

对于AI公司而言,此次事件是一个重要的教训,需要在追求产品功能和用户体验的同时,将数据安全和用户隐私保护放在首位。建立更加严格的数据处理流程、更加透明的用户政策以及更加有效的安全措施,将是赢得用户信任的关键。

在人工智能技术日新月异的今天,如何在创新与隐私之间找到平衡点,将是整个行业需要长期思考和实践的课题。