AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


搜索引擎 + GraphRAG + LLM 代理 = 人工智能智能搜索
发布日期:2024-08-31 11:22:48 浏览次数: 1874 来源:码农大牛毛


OpenAI 最近宣布推出由人工智能驱动的搜索引擎 SearchGPT,力图挑战谷歌长期以来的主导地位。

然而,MindSearch 就是这样一种创新,它是 SearchGPT 和 Perplexity 的开源替代品。在与可以连接互联网的 ChatGPT 和专注于 AI 搜索引擎的 Perplexity 的竞争中,MindSearch 在深度、广度和准确性方面都胜过这两款明星产品。

它甚至可以在不到 3 分钟的时间内收集并整合 300 多页的相关信息,而这项任务需要人类专家大约 3 个小时才能完成。

因此,让我给你一个实时聊天机器人的快速演示来向你展示我的意思。


我举个简单的例子:什么是 LangChain?如果你看一下 MindSearch 如何生成输出,你会发现它采用了基于图的方法。当我提交查询时,代理会将其分解为多个原子子问题。每个子问题都表示为有向无环图中的节点。LangChain 是起点,终点节点代表最终答案。

当代理处理用户查询和网络搜索结果时,图谱会动态构建。当检索到新信息时,代理会向图谱添加新节点和边。此图谱有助于跨不同代理进行上下文管理。通过维护子问题之间关系的清晰结构,代理可以使用图谱来汇总和综合信息。这有助于将检索到的数据组合成对原始查询的连贯而全面的响应。

在本分步指南中,我们将介绍什么是 MindSearch、MindSearch 的独特之处、为什么 MindSearch 比 ChatGPT-Web 和 Perplexity AI 好得多,以及如何在本地安装 MindSearch。

MindSearch 是什么?

MindSearch是上海人工智能实验室联合研发团队推出的开源AI搜索框架,融合了大规模信息收集与组织能力。

使用InternLM2.5 7B对话模型MindSearch 可以在 3 分钟内从 300 多个网页中收集有效信息,完成人类通常需要 3 小时才能完成的任务。它使用多智能体框架模拟人类思维,先规划再搜索,提高信息的准确性和完整性。

项目已完全开源,用户可免费体验、本地部署。

MindSearch 有何独特之处?

它由两个主要组件组成:WebPlanner 和 WebSearcher。WebPlanner 将用户的问题分解为部分搜索任务,并根据搜索结果确定下一步。此过程使用图形结构表示。同时,WebSearcher 执行分层信息搜索以收集相关信息。

MindSearch 的独特之处在于它能够有效地分解复杂问题,并高效地从大量网页中提取相关信息。它的多智能体设计使其能够在不到三分钟的时间内同时探索和综合来自 300 多个网页的信息,而人类专家执行类似的认知任务则需要大约三个小时。

MindSearch 是如何击败 ChatGPT 和 Perplexity.ai 的?

答案从它的名字开始说起。MindSearch 的核心竞争力在于它使用多智能体框架来模拟人类的思维过程。

答案从它的名字开始说起。MindSearch 的核心竞争力在于它使用多智能体框架来模拟人类的思维过程。

在实际使用中,MindSearch 展现出了令人印象深刻的性能,它能够在极短的时间内从海量网页中快速收集并整合有价值的信息。例如,面对一个复杂的搜索任务,它只需几分钟就能收集并整合数百页相关内容,而人类专家完成同样的任务可能需要几个小时。

在ChatGPT-web和Perplexity的对比测试中,MindSearch表现优异。例如面对“王者荣耀当前赛季哪个射手最强?”这样的问题,它会进行深度的逻辑分析,比如分析当前赛季的特点、衡量射手实力的指标等,然后结合各方信息给出全面而准确的答案,而不是简单地总结网上现有的回答。

本地安装 MindSearch

步骤 1:依赖项安装

  • 打开终端或命令提示符。在这里输入安装所需的所有命令。

  • 从 GitHub 克隆 MindSearch 存储库。这会将所有必要的文件下载到您的计算机。输入以下命令:

git克隆https://github.com/InternLM/MindSearch
  • 导航到 MindSearch 目录。克隆后,您需要进入创建的目录:

心灵搜索
  • 安装所需的 Python 包。存储库包含一个名为的文件requirements.txt,其中列出了所有必需的 Python 包。使用以下命令安装它们:

pip 安装 -r 要求.txt

第 2 步:设置 MindSearch API

了解命令结构。您将运行一个启动 MindSearch API 的 Python 模块。该命令有几个选项:

  • --lang en将模型语言设置为英语。您可以将en其更改cn为中文。

  • --model_format指定模型的格式。用于internlm_server针对中文优化的 InternLM2.5-7b-chat 模型或gpt4使用 GPT4。

启动 FastAPI 服务器。使用以下命令,根据您的设置调整参数:

开源模式

python -m mindsearch .app  --lang en --model_format internlm_server

GPT-4o

如果要使用 GPT4,则必须修改处理 API 模型配置的项目中模型'YOUR OPENAI API KEY'文件。然后用来自 OpenAI 的实际 API 密钥替换。

gpt4 = dict(type=GPTAPI, 
model_type = 'gpt-4-turbo' ,
key =os.environ.get( 'OPENAI_API_KEY' , '您的 OPENAI API 密钥' ))

如果您已经在配置文件中设置了 GPT-4,请确保启动服务器的命令指向正确的模型格式。

python -m mindsearch .app  --lang en --model_format gpt4

步骤3:设置MindSearch前端

  1. 运行 Gradio 界面

确保您位于 Gradio 脚本所在的 MindSearch 项目的根目录中,并在终端中使用以下命令启动 Gradio 界面。

python 前端/mindsearch_gradio.py
  1. 运行Streamlit应用程序:

使用以下命令运行 Streamlit 应用程序。Streamlit 将自动在您的默认 Web 浏览器中打开 Web 应用程序

streamlit 运行前端/mindsearch_streamlit.py

结论 :

MindSearch 为复杂的信息检索和集成任务提供了一种简单而强大的解决方案。其多代理框架将 LLM 的认知能力与搜索引擎的广泛数据访问相结合,使其有别于现有解决方案。通过分解查询、管理上下文和利用分层检索,MindSearch 显著提高了检索到的 Web 信息的准确率和召回率。凭借在短时间内高效处理大量网页的能力,MindSearch 为用户提供了做出明智决策所需的及时准确的信息



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询