在Google AI Overviews去年灾难性推出后,公众已经普遍意识到AI驱动的搜索结果与几十年来传统搜索引擎生成的链接列表可能存在巨大差异。如今,一项新研究帮助量化了这种差异,表明AI搜索引擎倾向于引用不太受欢迎的网站,这些网站甚至不会出现在"有机"Google搜索的前100个链接中。
研究方法与数据来源
在题为《生成AI时代网络搜索的特征》的预印本论文中,德国波鸿鲁尔大学和马克斯·普朗克软件系统研究所的研究人员比较了Google搜索引擎的传统链接结果与其AI Overviews以及Gemini-2.5-Flash的表现。他们还考察了GPT-4o的网络搜索模式以及独立的"带搜索工具的GPT-4o"——后者仅在大型语言模型(LLM)决定需要找到预训练数据之外的信息时才会转向网络搜索。

研究人员从多个来源收集测试查询,包括提交给ChatGPT的特定问题(WildChat数据集中)、AllSides上列出的普遍政治话题,以及100个搜索量最大的亚马逊产品列表中的产品。
研究发现:AI搜索倾向于引用小众来源
总体而言,生成式搜索工具结果中引用的来源往往来自比传统搜索前10名更不受欢迎的网站——这是通过域名跟踪器Tranco衡量的。AI引擎引用的来源比传统Google搜索链接的来源更有可能落在Tranco跟踪的前1,000和前1,000,000个域名之外。特别是Gemini搜索表现出引用不受欢迎域名的倾向,在所有结果中,中位数来源落在Tranco前1,000名之外。

AI驱动的搜索引擎引用的来源也往往是那些在相同有机Google搜索中不会出现在任何接近顶部结果的位置。例如,Google AI Overviews引用的53%的来源没有出现在相同查询的前10个Google链接中,40%的来源甚至没有进入前100个Google链接。
质量对比:AI搜索与传统搜索孰优孰劣?
这些差异并不一定意味着AI生成的结果"更差"。研究人员发现,基于GPT的搜索更有可能引用企业和百科全书等来源的信息,而几乎从不引用社交媒体网站。
基于LLM的分析工具发现,AI驱动的搜索结果往往覆盖与传统的前10个链接相似数量的可识别"概念",这表明结果在细节、多样性和新颖性方面处于相似水平。同时,研究人员发现"生成式引擎倾向于压缩信息,有时省略了传统搜索保留的次要或模糊方面"。对于更模糊的搜索术语(如不同人共享的名字),这种情况尤为明显,研究人员发现"有机搜索结果提供了更好的覆盖度"。
AI搜索的独特优势
AI搜索引擎 arguably 在能够将预训练的"内部知识"与从引用网站收集的数据编织在一起方面具有优势。对于带搜索工具的GPT-4o尤其如此,它通常不引用任何网络来源,而是 simply 基于其训练提供直接响应。
但这种对预训练数据的依赖在搜索最新信息时可能成为限制。对于从Google 9月15日趋势查询列表中提取的搜索术语,研究人员发现带搜索工具的GPT-4o通常回复"能否请您提供更多信息"之类的信息,而不是实际搜索网络以获取最新信息。
行业影响与未来展望
研究人员虽然没有确定基于AI的搜索引擎整体上是否比传统搜索引擎链接"更好"或"更差",但他们确实敦促对"新的评估方法"进行未来研究,这些方法"共同考虑生成式搜索系统中的来源多样性、概念覆盖度和综合行为"。
这一发现对搜索引擎行业具有重要意义。随着AI搜索的普及,信息获取方式正在发生根本性变化。传统搜索引擎依靠算法确定哪些网站最受欢迎,而AI搜索则能够深入挖掘更广泛的资源,提供更加多元化的信息视角。
用户视角的思考
从用户角度来看,这种变化既有优势也有挑战。一方面,AI搜索能够提供更加多元化的信息来源,打破传统搜索结果中可能存在的信息茧房。另一方面,用户需要更加谨慎地评估AI生成内容的可靠性和权威性。
对于研究人员、学者和内容创作者而言,这一趋势意味着他们的工作可能会被新的搜索算法以不同方式发现和引用。那些在传统搜索排名中不占优势的网站和内容,现在有机会通过AI搜索获得更多曝光。
技术发展的必然趋势
AI搜索与传统搜索的差异反映了人工智能技术在信息检索领域的应用正在不断成熟。随着大型语言模型和生成式AI技术的进步,我们可以预见搜索引擎将继续演变,融合两种方法的优点。
未来的搜索引擎可能会更加智能地平衡权威来源与多元视角,既考虑传统排名指标,又利用AI的深度理解和内容生成能力。这种融合将使搜索结果更加全面、准确和有用。
结论
AI搜索与传统搜索的对比研究表明,技术正在以前所未有的方式改变我们获取信息的方式。虽然AI搜索倾向于引用更加多元和小众的来源,但这并不一定意味着质量下降,而是反映了信息获取方式的多样化。
随着这一领域的不断发展,研究人员、开发者和用户都需要适应这一变化,共同探索如何最好地利用AI搜索的潜力,同时保持对信息质量和可靠性的严格要求。未来的搜索引擎将不仅仅是信息的提供者,更是知识的整合者和解释者。










