我要投稿

LLM｜利用Ollama搭建个人本地知识库

发布日期：2024-07-16 07:20:28 浏览次数： 6297 作者：科技代表

最近一直想基于RAG（检索增强生成，Retrieval-Augmented Generation）和大语言模型（Large Language Model, LLM）技术搭建一套属于自己的个人知识库，以为会涉及到诸多复杂的流程，包括模型调用、界面开发等。今天找到了一点资料，发现特别简单，花了几分钟实现了一下，主要用到了三个软件：

Ollama
Docker
AnythingLLM

1 基本资料介绍

大预言模型已经很常见了，包括ChatGPT、Claude、通义千问等等，此处就不再过多介绍了，这里主要介绍用到的几个软件和基本技术。

1.1 RAG

检索增强生成（RAG）是指对大型语言模型输出进行优化，使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型（LLM）用海量数据进行训练，使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上，RAG 将其扩展为能访问特定领域或组织的内部知识库，所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法，让它在各种情境下都能保持相关性、准确性和实用性。

与RAG并生的另一种技术叫监督式微调（SFT），是将LLM模型注入新的知识库并将模型本身进行训练以获得所需要的结果，需要有一定的硬件设备。两种技术并不矛盾，其实互相结合才是最好的解决方案。本文不对此过多介绍，具体可网上搜索相关概念。

1.2 Ollama

ollama是一个开源的大型语言模型服务工具，它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。 Ollama 的主要功能是在Docker容器内部署和管理大型语言模型（LLM），使得用户能够快速地在本地运行这些模型。 Ollama官网地址：https://ollama.com/

1.3 Docker

Docker 是一个软件平台，让您可以快速构建、测试和部署应用程序。Docker 将软件打包成名为容器的标准化单元，这些单元具有运行软件所需的所有功能，包括库、系统工具、代码和运行时。使用 Docker，可以将应用程序快速部署和扩展到任何环境中。

Docker官网地址：https://www.docker.com/

1.4 AnythingLLM

AnythingLLM是由Mintplex Labs Inc.开发的一个全栈应用程序，是一款高效、可定制、开源的企业级文档聊天机器人解决方案。它能够将任何文档、资源或内容片段转化为大语言模型在聊天中可以利用的相关上下文。 AnythingLLM支持几乎所有的主流大模型和多种文档类型，可定制化，而且安装和设置简单。

2 实现流程

2.1 安装Ollama

下载Ollama（网址：https://ollama.com/download）
下载直接一路Next即可
在Ollama官网下载基准大预言模型，点击Models-Filter by name。我这里用的qwen2

我这里选择了qwen2:7b模型，大小为4.4G。

双击图标，运行ollama。之后，打开终端，windows电脑：win+cmd；mac电脑：图标终端。粘贴刚刚复制的命令，回会车，即可自动下载模型（可能网络会有些问题）
进一步，直接可以对话提问了。（不要关闭）

2.2 安装Docker

下载Docker，网站：https://www.docker.com/
直接安装即可，非常简单
双击运行

2.3 安装AnythingLLM

其实，AnythingLLM也有自己的界面，这里我们直接在Docker里面安装。

ctrl+K或command+K，搜索AnythingLLM，并点击Pull，自动开始下载

下载好后，点击左侧栏目的Images，在右侧的镜像列表中点击AnythingLLM，再点击run启动镜像。
配置端口号，随便输入个4位数即可（不要与现有的容器名和端口冲突即可）

启动服务，跳转到浏览器

选择Ollama，选择刚刚下载好的qwen2:7b模型，max token自己任取

按如下选择，其他保持默认即可

这里是选择的配置，其中：Embedding Preference是Embedding偏好的模型，这里默认选择的是AnythingLLM Embedder；Vector Database向量库默认选择LanceDB

下一步输入邮件地址和用途，输入工作区名称，进入主页面

点击左侧的“个人知识库”，即可开始对话。当然在这之前，我们先上传个人知识库
点击上传按钮

上传文档，移动到右侧工作区，并将文档向量化（本地执行），稍等一下即成功。

回到主页面，选择“个人知识库“，开始对话。可以看到，结果还是很准的。

可在设置里面调整工作区名称、头像、文档相似性阈值等信息

3 结论

本期属于不务正业，基于RAG的个人本地知识库搭建还是很简单的，后面尝试把专业相关的知识注入进去，方便自己的个人知识库检索。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-05-15

当RAG拥有“大脑”：揭秘Agentic RAG的进化之路

2025-05-15

RAG不好用？试试MCP这个“知识库优化大师”

2025-05-14

RAG常见的坑：如何让AI有效的考试作弊

2025-05-14

人人都能看懂的预训练、微调、提示词工程和 RAG(我保证)

2025-05-14

DeepSeek接入个人知识库，回答速度飞快，最新安装包即将发布！

2025-05-14

RAG创始人关于RAG Agent的10个思考(上)

2025-05-14

RAG提升召回准确率的解决方案——关于相似度计算与Rerank重排序的问题研究

2025-05-14

随着大模型技术的发展——RAG技术有可能会被淘汰吗？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

随着大模型技术的发展——RAG技术有可能会被淘汰吗？

2025-05-14

AI知识库到底是什么？不同应用场景如何调参数配置？

2025-05-14

AI 全栈工程体系中，Prompt Engineering、AI Agent 和 RAG 如何协同工作？

2025-05-13

一文读懂RAG：AI的“外部知识库”如何让回答更精准？

2025-05-11

25种RAG架构大揭秘：AI项目如何选型？

2025-05-08

RAG系统中的偏见问题：如何让AI更公平？

2025-05-05

如何用大模型+RAG给宠物做一个AI健康助手（干货分享）？

2025-04-30

RAG开发框架LangChain与LlamaIndex对比解析：谁更适合你的AI应用？

2025-04-29

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部