我要投稿

大模型联网搜索是怎么回事？一文搞懂AI联网搜索原理

发布日期：2025-03-16 05:46:48 浏览次数： 2545 作者：但丁自留地

前言

前面一系列的文章里，我们提到了AI大模型的一些能力限制，其中就包括了数据时效性不够，依赖于模型训练的时效。为此有几种解决方式，上一篇《让模型更懂你的业务！RAG原理和解决方案解析》提到了RAG外挂知识库的方式，另一种方式就是使用联网搜索。

前一段时间DeepSeek的火热，正式将大模型联网搜索能力带入了公众视野，风头一时无两。

它的出现，同时弥补了AI大模型数据时效性的问题，以及传统搜索引擎以关键词倒排索引匹配为主，无法理解语义和上下文的缺陷。

那么你有没有好奇过：大模型联网搜索是怎么一回事？它能完全替代搜索引擎吗？

本文就准备在前面一系列文章的铺垫之下，来探讨一下大模型联网搜索的实现原理。需要背景知识的可以回看一下《AI Agent：大模型落地应用的“最后一公里”》和《实战干货！如何使用Java构建企业级AI Agent服务框架？》。

大模型联网搜索的基本原理和流程

先给结论：AI联网搜索是一种Agent能力的应用，它并不是模型自带的。

简单画了一下AI联网搜索的流程示意图如下：

用户使用AI联网搜索进行提问时，大模型先语义解析用户的问题，从中提取出需要通过网络检索的关键词，比如用户提问“历史上的今天”，由于大模型没有时效性信息，它就需要通过网络去检索相关信息，根据用户的提问，它可能提取出来的搜索关键词为，“历史上的今天 3月15日”。

然后大模型通过Agent能力，调用浏览器去检索相关关键词。这里的Agent能力通常为某种搜索引擎API。搜索引擎返回搜索网页结果后，大模型再继续调用Agent能力去解析返回的网页，从中提取出文本内容。

然后将提取出的检索结果内容作为问答的上下文，结合prompt再一次同大模型交互，大模型进行内容生成和聚合，并且返回最终结果。

这么看起来，是不是有点熟悉了？跟《让模型更懂你的业务！RAG原理和解决方案解析》里讲述的过程似乎挺类似的。确实！下面会有一节来对比一下RAG和AI联网搜索的相同和差异。

核心技术点解析

查询生成
这个阶段，可能需要从用户输入的自然语言形式的问题中提取出有效的搜索查询关键词出来，当然也可能需要判断是否需要检索。如果用户输入的问题与时效性无关，可能压根就不需要涉及联网搜索。
这个自然就是大模型的强项所在。它可以将用户模糊的、有歧义的内容，通过问题改写、意图识别、多轮对话等方式正确理解，并提取出合适的关键词供后续的检索使用。
内容提取
如何从搜索引擎返回的结果中筛选出与问题最相关的网页结果？这可能是一个难度颇高的问题，涉及到两方面：
一是如何从搜索引擎返回的成千上万的结果中选择使用哪些网页；
二是如何从返回的网页中获取内容并获得与问题最相关的网页片段；
这里我只能谈一谈我自己的猜测，后面可能会采取一些实验去验证想法。
首先可能采用搜索引擎的相关性评分，优先采取评分高的返回结果；
但是我们都知道搜索引擎并不是总是将相关性最高的优先返回，竞价排名机制对结果的影响很大，所以可能根据摘要结合语义相似度来进一步判断；
可能还有一些其他的机制，比如网站权重等，大模型优先从一些专业性权威性较高的网站获取内容；
获取到搜索引擎返回的网页链接后，AI联网搜索还需要进行网页访问，从中解析出文本内容，并找到与原始问题最相关的片段，这涉及到网页爬取解析工具，不赘述。
信息整合
这个阶段，大模型可能会遇到一些不同来源、数据正确性不一致的信息，过时的、冗余的、冲突的信息，会对联网搜索的处理带来挑战，类似大模型的幻觉，这也会导致AI联网搜索给出不正确的信息。
在使用DeepSeek R1这样的推理模型时，我们有时候会看到模型的推理过程中会输出检索到了互相矛盾的结果，模型从中采信了哪一个的过程，它会结合事实核查和自身预训练的知识进行观点融合，但并不能保证它每次都能够去伪存真。
答案生成
在这个阶段，大模型已经获取到了足够的上下文内容，针对用户问题进行内容生成是大模型的强项，只要数据正确性无误，基本上大模型可以生成流畅、准确、自然的答案。
这阶段主要的问题就是基于大模型自身的幻觉问题，也是最让人头疼的问题。正是由于它生成的内容足够流畅自然，表达自信十足，甚至逻辑上条理清晰，看起来有理有据，让人很难在缺乏足够背景知识的情况下，快速分辨出AI生成结果的错误。

RAG和AI联网搜索对比

通过上面的原理解析，可以看出来AI联网搜索跟RAG的流程很像：

RAG是AI+知识库，而联网搜索是AI+Web，RAG依赖向量检索，联网检索依赖搜索引擎。

下面详细对比一下二者的相同和差异：

相同点：

	AI RAG	AI联网搜素
解决的问题或目标	通过检索外部信息增强生成内容的准确性和相关性，解决模型的时效性问题	通过联网检索实时信息补充生成内容，解决模型的时效性问题
检索机制	都需要依赖某种搜索机制获取外部信息（向量检索）	都需要依赖某种搜索机制获取外部信息（搜索引擎）
生成能力	结合检索结果生成自然语言结果
依赖数据源	需要外部数据源（外挂知识库）	需要外部数据源（互联网数据）

差异点：

	AI RAG	AI联网搜索
数据来源	通常为外挂的私有内部知识库	互联网公开的来源的数据
实时性	较低，取决于知识库的更新频率	高，实时获取最新信息
可控制性	可以定制数据源，通常可以保证数据正确性，敏感信息可以过滤和控制	数据源不可控，数据正确性、合规性依赖于互联网数据生产
隐私合规	数据本地化，安全性高	数据来源互联网，正确性和合规性均无法保证，需手动控制
检索技术	向量检索，支持语义检索，需自行实现	关键词检索，依赖模型提取关键词，检索依赖互联网API
成本	通常需要结合知识生产环节，前期构建知识库成本高，维护复杂	无构建环节，按需调用检索API，成本与使用量相关
应用场景	企业知识库、垂类专业知识领域（如医疗法律等要求准确性高）	通用信息查询（如新闻天气要求实时性高）