我要投稿

本地大模型构建知识库 Ollama + LobeChat + AnythingLLM

发布日期：2024-07-31 20:21:25 浏览次数： 3165 作者：李东bbsky

（本文封面图来源于unsplash）

在本地使用大模型搭建知识库，可以充分保障数据的隐私和安全，同时由于不需要依赖网络连接方便企业内部使用此外，最重要的是能够对模型和知识库进行定制化，根据具体需求进行调整，从而更好地满足特定业务场景的要求，既能供企业内部使用，也能做成Server供客户使用。

哪里可以获取大模型？

大模型的种类很多，而且版本更新比较频繁，不过当前所有流行的开源大模型都可以在HuggingFace上下载。HuggingFace可以说是AI模型领域的Github，这里有70多万种模型，涵盖多模态、计算机视觉、NLP、强化学习等领域。

通过HuggingFace的分类Libraries下的Transformers就能获取到大模型的Trending流行趋势信息，其中Meta的羊驼Llama3系列、法国Mistral AI的Mistral系列、阿里的Qwen系列是目前业内最广泛使用的开源大模型。

同时我们也可以关注和了解一下开源大模型的横向评分测评，以下是这三个大模型的评测对比，阿里的通义千问Qwen2-72B是当前这个规模最强的开源模型。不过我之所以更推荐国内用户选择Qwen2，主要是开源大模型对中文的支持程度不同，Qwen2更适合国内用户。

Ollama、WebUI工具链

为了方便在本地部署大模型，就需要使用大模型的运行框架，可供选择的方案有vLLM、LM Studio等，这里更推荐Ollama。Ollama支持Windows、MacOS、Linux平台，能够智能地利用可用的的硬件资源（GPU和CPU）加速推理并优化性能，能够非常方便地安装和管理各种大模型，包括Qwen2。

Ollama的安装，以及使用Ollama部署模型都非常简单，在官网下载安装好之后通过以下命令就能部署安装qwen2 7b的模型，而如果你的本地硬件配置足够，可以选择72b的模型。

ollama run qwen2

大模型部署完成后通常只有一个命令行的界面，而有了Ollama丰富的生态，我们可以借助于一些WebUI工具能与大模型进行聊天的交互，也可以基于API，将大模型与应用程序和工作流集成。

至于WebUI，可供选择的方案也有很多，比如Open WebUI，NextChat，我个人比较喜欢使用LobeChat，因为它支持很多闭源模型的API，也支持云端部署的大模型，还支持离线部署的大模型。

我们可以使用Docker在本地安装LobeChat，至于如何在LobeChat中使用Ollama可以看官方的文档：https://lobehub.com/zh/docs/usage/providers/ollama

RAG应用的构建

如果只是想要拥有一个离线的大模型聊天平台，以上内容就可以解决你大部分问题，但既然你要选择在本地部署大模型，显然就不该止步于此，你可以结合本地大模型+Ollma+个人或企业内部的资料（知识库）来定制化开发专属而私密的RAG应用。

RAG的框架有很多，比如RAGFlow、AnythingLLM、Verba、Flowise、Langflow、Quivr等等，这里只以AnythingLLM为例。
AnythingLLM和Ollama一样也支持MacOS、Windows。Linux，安装完成打开软件，可以看到如下操作界面，在大模型服务商里选中Ollama后，输入Ollama的服务端模式的地址（可以通过在终端输入ollama serve开启）http://127.0.0.1:11434之后，就能看到我们之前安装的Qwen2 7b的模型了。