AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI搜索引擎私有化部署:Gemma2+Perplexica,拉爆Llama3 Qwen2
发布日期:2024-07-17 10:25:13 浏览次数: 1980


虽然在不久前的Google I/O大会上,Gemma 2的开源消息已经公之于众,但谷歌还为我们准备了一份额外的惊喜——

除了拥有27B参数的模型外,谷歌还推出了一个更为精简的9B参数版本。

DeepMind的创始人哈萨比斯宣称,在27B参数的规模下,Gemma 2展现出了同类模型中的顶尖性能,其能力甚至可以与参数量为其两倍的模型相媲美。

Gemma 2已经成功跻身于大型模型竞技场(LMSYS Chatbot Arena),在27B参数的规模下,它的表现令人印象深刻,与参数量高达70B的Llama3相媲美,更令人惊讶的是,Gemma 2的9B版本在竞技场中同样表现出色,其排名甚至能与72B参数的Qwen 2相提并论。这一结果不仅证明了Gemma 2在不同参数规模下都能保持高效能,也展示了其在性能与资源利用上的卓越平衡。支持多种平台和工具,易于微调,能够用于金融、医疗、营销、供应链、人力资源和自然语言处理等多个领域。

接下来,我们来测试一下Gemma2的推理能力。Gemma2可以通过谷歌的AI Studio平台直接进行测试。在平台界面的右上角,可以选择Gemma2模型。

为了评估Gemma2在时间推理方面的性能,我们选择了一个时间推理问题作为测试案例:假设今天是星期五,那么48小时后是星期几?只需点击'运行'按钮,Gemma2便迅速给出了答案

此外,Gemma2还展示了其计算过程,验证了答案的准确性。

现在,让我们进一步测试Gemma2在条件逻辑推理方面的表现。我们提出了一个典型的逻辑推理问题

Gemma2迅速给出了肯定的回答,并解释说,这是逻辑学中著名的三段论。

扔一个经典问题给他,因为我们的提问包含了暴力词汇,他还给出了警告信息


接下来展示如何在本地部署Gemma2,并利用开源项目Proplexica卡来构建一个类似于Proplexica的AI搜索引擎。

首先,确保已经安装了Ollama,可以访问Ollama的官方网站进行下载和安装。

安装完成后,只需执行以下命令,即可自动下载并启动Gemma2。这将为您的本地环境带来强大的AI搜索能力。


让我们进入下一步:部署Perplexica,它是一个开源的、由人工智能驱动的搜索引擎,其设计目标是提供与Perplexica相媲美的智能搜索体验。

Perplexica不仅仅是一个搜索工具,它能够深入理解用户的查询意图,并利用最前沿的机器学习技术,如相似性搜索和向量嵌入,来提供精确和全面的搜索结果。这些先进的算法确保了搜索结果的相关性和深度,使用户能够快速找到所需信息。

项目地址:https://github.com/ItzCrazyKns/Perplexica

下载地址:https://github.com/ItzCrazyKns/Perplexica/archive/refs/heads/master.zip

下载Perplexica项目完成后,我们首先需要解压文件。解压后,打开包含项目文件的文件夹。接下来进入到项目所在的目录。

在项目目录中,我们需要定位到特定的配置文件。找到名为'sample.config.toml'的文件,请注意,文件名前缀有'sample.'。我们将这个前缀去掉,这样文件名就变成了'config.toml'。


接下来,打开'config.toml'文件,填写ollama的接口地址

保存关闭,我们的配置就完成了。现在,Perplexica应该已经根据我们的设置正确配置,可以开始使用了。

在命令行项目目录下执行:

docker compose up -d


安装完成后打开浏览器:http://127.0.0.1:3000

接下来,我们将继续进行设置。首先,点击界面左下角的齿轮图标,这将打开设置菜单。在这里,您会看到第一个选项是“主题”。您可以根据自己的偏好选择亮色或暗色主题,以获得最佳的视觉效果和使用体验。

在设置中,接下来需要选择“聊天模型的提供者”。在这里,我们推荐选择“Ollama”,因为它是我们之前配置的AI平台。然后,在“聊天模型”选项中,选择我们刚才运行的“Gemma2 latest”版本,以确保与我们的搜索系统集成。

同样地,在“嵌入模型提供者”选项中,我们继续选择“Ollama”。对于“嵌入模型”,同样选择“Gemma2”,以保持一致性并充分利用其功能。

如果您有其他偏好或需要,也完全可以选择其他的模型提供者和模型。

配置完成之后就可以,用来搜索关键词了

给出了相关链接,生成了简介,并给出了相关的搜索问题。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询