AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Github推荐:Perplexica - 一款AI驱动的搜索引擎
发布日期:2024-09-12 22:55:53 浏览次数: 1552



概述

Perplexica 是一款开源的AI驱动搜索工具,旨在深入互联网查找答案。它的灵感取自Perplexity AI,是一个不只进行网页搜索的开源替代品,它能够理解用户的问题。通过使用先进的机器学习算法,比如相似性搜索和嵌入方式,Perplexica能够精炼搜索结果,并提供清晰的答案及其来源。

Perplexica采用SearxNG作为搜索引擎,以确保获取最新信息,同时保护用户隐私。

功能特点

  • 本地LLMs: 支持使用本地的LLMs,如Llama3和Mixtral,通过Ollama连接。

  • 两种主要模式

    • 副驾驶模式(开发中):通过生成不同的查询以找到更相关的互联网资源,从而增强搜索效果。它不仅依赖于SearxNG提供的上下文,而是访问顶级匹配项,直接从页面查找与用户查询相关的资源。

    • 普通模式:处理用户查询并执行网页搜索。

  • 聚焦模式:针对特定问题类型的特殊模式。Perplexica目前提供6种聚焦模式:

    • 全部模式:搜索整个网络以找到最佳结果。

    • 写作助手模式:适用于无需搜索网络的写作任务。

    • 学术搜索模式:查找文章和论文,非常适合学术研究。

    • YouTube搜索模式:根据搜索查询查找YouTube视频。

    • Wolfram Alpha搜索模式:回答需要计算或数据分析的查询。

    • Reddit搜索模式:搜索Reddit上的讨论和相关意见。

  • 最新信息:某些搜索工具可能提供过时信息,因为它们使用爬虫生成数据并转换为嵌入后存储在索引中。与此不同,Perplexica利用SearxNG这个元搜索引擎获取最新结果并进行重新排序,确保用户获取最新信息,而不需进行每日数据更新。

它还具有图像和视频搜索等多项功能,计划中的功能可在即将推出的功能中查看。

安装指南

Perplexica的安装主要有两种方法:使用Docker和不使用Docker。推荐使用Docker。

使用Docker进行安装(推荐)

  1. 确保你的系统上安装并运行Docker。

  2. 克隆Perplexica项目仓库:

    git clone https://github.com/ItzCrazyKns/Perplexica.git
  3. 克隆后,进入项目文件目录。

  4. sample.config.toml文件重命名为config.toml。对于Docker设置,仅需填写以下字段:

    注意:启动Perplexi**ca后,可以通过设置对话框更改这些选项。

  • SIMILARITY_MEASURE: 要使用的相似度度量(此项默认为填写,如不确定可以保持原状)。

  • OPENAI: 你的OpenAI API密钥。如需使用OpenAI的模型,才需填写此项

  • OLLAMA: 你的Ollama API URL。应填写为http://host.docker.internal:PORT_NUMBER。如果你在端口11434安装了Ollama,则使用http://host.docker.internal:11434。对于其他端口,按需调整。如需使用Ollama的模型而非OpenAI的,则必需填写此项

  • GROQ: 你的Groq API密钥。如需使用Groq的托管模型,才需填写此项

  • ANTHROPIC: 你的Anthropic API密钥。如需使用Anthropic的模型,才需填写此项

  • 确保你在包含docker-compose.yaml文件的目录中,执行:

    docker compose up -d
  • 等待几分钟以完成设置。在浏览器中访问http://localhost:3000以访问Perplexica。

  • 注意:构建容器后,可以直接从Docker启动Perplexica,无需打开终端。

    非Docker安装

    1. 安装SearXNG,并在SearXNG设置中允许JSON格式。

    2. 克隆仓库,并在根目录将sample.config.toml文件重命名为config.toml。确保填写此文件中的所有必填字段。

    3. ui文件夹中的.env.example文件重命名为.env,并填写所有必要字段。

    4. 填充配置和环境文件后,在ui文件夹和根目录中运行npm i

    5. 安装依赖项后,在ui文件夹和根目录中执行npm run build

    6. 最后,通过在ui文件夹和根目录中运行npm run start来启动前端和后端。

    注意:推荐使用Docker,因为它可以简化设置过程,特别是在管理环境变量和依赖关系方面。

    如需更多信息,例如如何将其公开到网络等,请查看安装文档。

    使用Perplexica作为搜索引擎

    如果希望将Perplexica用作传统搜索引擎(如Google或Bing)的替代品,或想要为浏览器的搜索栏添加快速访问快捷方式,请遵循以下步骤:

    1. 打开浏览器设置。

    2. 导航至“搜索引擎”部分。

    3. 添加新站点搜索,使用以下URL:http://localhost:3000/?q=%s。如果Perplexica不是本地托管,则将localhost替换为你的IP地址或域名,并在3000处填写相应的端口号。

    4. 点击添加按钮。现在你可以直接从浏览器的搜索栏使用Perplexica。

    即将推出的功能

    •  添加设置页面

    •  支持本地LLMs

    •  添加历史保存功能

    •  引入多种聚焦模式

    •  最终确定副驾驶模式

    •  添加发现功能

    类似项目介绍

    在开源搜索引擎领域,还有几个功能类似的项目可以考虑:

    1. Searx:一个隐私友好的元搜索引擎,可以同时从多个搜索引擎获取结果,用户控制搜索内容和隐私设置。

    2. DuckDuckGo:一个注重隐私的搜索引擎,除了传统的搜索结果外,增加了隐私保护功能,防止用户被追踪。

    3. YaCy:一个点对点的搜索引擎,以去中心化的方式进行网页索引与搜索,不依赖于任何单一实体来进行搜索。

    这些项目各具特色,能够满足不同用户在搜索引擎方面的需求。

    通过Perplexica,你能够体验到更智能、精准的搜索体验,欢迎大家前来使用和探索!



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询