10月28日消息,自去年谷歌推出引发争议的“AI概览”(AI Overviews)功能后,公众已普遍认识到:人工智能驱动的搜索结果,和搜索引擎数十年来提供的传统链接列表有着显著区别。如今,一项新研究对这种差异进行了量化分析,发现AI搜索引擎更倾向于引用那些访问量较低、甚至在传统谷歌搜索前100名结果中都难觅踪迹的网站。
IT之家留意到,在一篇题为《生成式人工智能时代的网络搜索特征分析》("Characterizing Web Search in The Age of Generative AI")的预印本论文里,德国波鸿鲁尔大学(Ruhr University in Bochum)和马克斯・普朗克软件系统研究所(Max Planck Institute for Software Systems)的研究人员,把谷歌传统搜索结果同其AI概览(AI Overviews)、Gemini 2.5-Flash展开对比,同时还纳入了GPT-4o的网页搜索模式,以及“GPT-4o搭配搜索工具”(也就是只有当大语言模型判定需要外部信息时才调用网络搜索)的表现情况。
当然,这些差异并不代表AI生成的结果就必然“更差”。研究表明,依托GPT的搜索更偏向于将企业官网和百科类网站作为信息来源,并且几乎不会引用社交媒体上的内容。
一项依托大语言模型构建的分析工具表明,AI搜索结果中可被识别的“概念”数量,与传统搜索前十条结果的概念数量处于同一量级,这意味着二者在信息的细节丰富度、内容多样性以及新颖程度上的表现相差无几。不过研究人员也特别提到:“生成式AI引擎常常会对信息进行整合压缩,偶尔会略去一些次要或表述模糊的内容,而这些内容在传统搜索的结果里依旧能被找到。”这种差异在搜索词含义模糊的情况下(比如多个公众人物使用相同名字)会表现得更为明显,这时“传统搜索结果的信息覆盖范围会更具全面性”。
另一方面,AI搜索引擎也具备自身的优势——它们可以把通过预训练所获取的“内部知识”和引用网页里的信息融合起来。这一特点在“GPT-4o搭配搜索工具”的模式中体现得格外突出:这种模式往往不会提供任何外部引用链接,而是直接依据自身的训练数据来给出答案。
不过,这种对预训练数据的依赖在查询时效性高的信息时也可能变成弱点。研究人员用谷歌9月15日“实时热搜榜”里的关键词测试时,发现“GPT-4o 搭配搜索工具”常常给出“您能否提供更多详细信息?”这类回应,而不是主动去搜索最新的网络信息。