微信扫码
与创始人交个朋友
**点击上方蓝字 关注我**
在《一个尊重个人隐私的搜索引擎,可以私有化部署,Star 9.6+!》一文中我们详细介绍了一个无广告,尊重个人隐私的搜索引擎-SearXNG。在文章的结尾我们抛出了一个猜想话题:
“有可能基于LLM+SearXNG的问答式搜索会不会是下一代搜索引擎的发展新趋势”
为什么会这么猜想,个人觉得当搜索引擎+大模型结合时,不同于现有的搜索引擎模式,至少在以下两个层面的能力有所增强:
更智能的搜索推荐:大模型能够更好地理解搜索意图和上下文,从而为我们提供更加个性化和精准的搜索推荐结果,甚至可能在我们自身还没明确问题内容的情况下就能得到相关建议。
更深入的内容理解:大模型使得搜索引擎能够更深入地理解复杂的查询内容,例如复杂的逻辑文本、文档。这种能力可能会推动搜索引擎向更高级的文本理解和语义理解方向发展。
而今天给大家介绍的就是一款基于大模型+SearXNG的AI搜索引擎-Perplexica
? 项目信息
#Github地址
https://github.com/ItzCrazyKns/Perplexica
项目截图
本地模型支持:可以使用 Ollama 部署本地模型,例如 llama3 和 Mixtral。
两种主要模式:
Copilot 模式:(正在开发中)通过生成不同的查询来查找更多相关的互联网资源,从而提高搜索效率。与常规搜索一样,它不仅仅使用 SearxNG 的上下文,而且访问最热门的匹配项,并尝试直接从页面查找与用户查询相关的资源。
正常模式:处理您的查询并执行网络搜索。
专注模式:可以更好地回答特定类型的问题。Perplexica 目前有 6 种专注模式:
全部模式:搜索整个网络以找到最佳结果。
写作助手模式:有助于完成不需要搜索网络的写作任务。
学术搜索模式:查找文章和论文,非常适合学术研究。
YouTube 搜索模式:根据搜索查询查找 YouTube 视频。
Wolfram Alpha 搜索模式:使用 Wolfram Alpha 回答需要计算或数据分析的查询。
Reddit 搜索模式:在 Reddit 上搜索与查询相关的讨论和意见。
当前信息:某些搜索引擎可能会提供过时的信息,因为它们使用来自爬虫的数据并将其转换、嵌入并存储在索引中。与它们不同,Perplexica 使用元搜索引擎 SearxNG 来获取结果并重新排序,并从中获取最相关的来源,确保始终获得最新信息,而无需每天更新数据。
Perplexica 的架构包括以下关键组件:
用户界面 :一个基于 Web 的界面,允许用户与 Perplexica 进行交互,搜索图像、视频等。
Agent/Chains :这些组件预测 Perplexica 的下一步操作,理解用户查询,并决定是否需要进行网络搜索。
SearXNG :Perplexica 使用的元数据搜索引擎SearXNG在网络上搜索来源。
LLMs:用于理解内容、撰写响应并引用来源。例如 GPT 等。
嵌入模型 :为了提高搜索结果的准确性,嵌入模型使用诸如余弦相似度和点积距离等,相似性搜索算法对结果进行重新排序。
0、准备机器
本次部署我们采用的是腾讯云上的云主机,8C16G,200G的磁盘,OpenCloudOS 操作系统,按照流量付费。
1、本地模型安装
本次我们接入的是本地模型 llama3,部署 llama3 我们采用 Ollama。当然网络没问题的同学也可以采用OpenAi接入。
#部署ollama,cpu only
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
#加载llama3模型
docker exec -it ollama ollama run llama3
出现下图,说明部署成功
2、Perplexica安装
官方推荐项目采用Docker进行安装。
确保 Docker 已在操作系统安装并正在运行。
克隆 Perplexica 存储库:
#clone master仓库会build失败,所以本次clone的v1.5.0版本
git clone https://github.com/ItzCrazyKns/Perplexica.git
克隆后,进行项目文件目录
cd Perplexica
将文件重命名sample.config.toml
为config.toml
cp sample.config.toml config.toml
#修改config.toml文件
OLLAMA = "http://xxx.xxx.xxx.xxx:11434"
启动应用
docker compose up -d
#显示如下,则部署成功
docker-compose up --build`.
Creating perplexica_searxng_1 ... done
Creating perplexica_perplexica-backend_1 ... done
Creating perplexica_perplexica-frontend_1 ... done
浏览器中通过 http://hostip:3000 访问 Perplexica
如果希望使用 Perplexica 来替代浏览器(比如Chrom)中的默认搜索引擎,可以按照以下步骤操作:
部署 Perplexica 的过程还有有点曲折的,有些问题还需要从项目的Issues中寻找解决方案,如果也有同学在部署的时候遇到了问题,可以留言寻求帮助哈。
但是AI驱动搜索引擎的前景非常广阔。随着技术的不断进步和应用场景的不断拓展,我们有理由相信AI将引领搜索引擎进入一个全新的时代。
53AI,大模型落地应用首选服务商
定位:开箱即用的大模型落地应用平台
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
如果你看见AI对商业世界的变革,欢迎来和我们一起探索~
2024-07-01
为什么很多人都放弃LangChain了?
2024-07-01
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
2024-07-01
腾讯AI Lab技术报告:一种以10亿人物角色驱动的新颖数据构造方法
2024-07-01
RAG坦途已现!DSPy,将会革命性改变RAG系统的构建方式
2024-07-01
扫码枪+AI:一扫生成药品信息卡片,说明书可以扔了!|AI 教程
2024-07-01
Jina Reranker v2:多语言支持、函数调用、代码搜索,超快推理!
2024-07-01
Quivr:开启个性化智能助理新纪元
2024-07-01
生成式智能体:人类行为的交互式模拟
2024-04-24
2024-05-14
2024-04-24
2024-04-23
2024-04-11
2024-04-26
2024-03-22
2024-03-29
2024-04-25
2024-04-12