我要投稿

27K star！有没有显卡都能搞，快速基于LLM构建本地智能知识库

发布日期：2024-06-20 20:58:02 浏览次数： 3712

作者：IT咖啡馆

微信搜一搜，关注“IT咖啡馆”

觉得搞一个AI的智能问答知识库很难吗？那是你没有找对方向和工具，

今天我们分享一个开源项目，帮助你快速构建基于Langchain 和LLM 的本地知识库问答，在GitHub已经获得27K star，它就是：Langchain-Chatchat

Langchain-Chatchat 是什么

Langchain-Chatchat基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，开源、可离线部署的检索增强生成(RAG)大模型知识库项目。

本项目利用 langchain 思想实现的基于本地知识库的问答应用，目前langchain可以说是开发LLM应用的首选框架，而本项目的目标就是建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

依托于本项目支持的开源 LLM 与 Embedding 模型，本项目可实现全部使用开源模型离线私有部署。与此同时，本项目也支持 OpenAI GPT API 的调用，并将在后续持续扩充对各类模型及模型 API 的接入。

实现原理

本项目全流程使用开源模型来实现本地知识库问答应用，最新版本中通过使用 FastChat 接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型，依托于 langchain 框架支持通过基于 FastAPI 提供的 API 调用服务，或使用基于 Streamlit 的 WebUI 进行操作。

可以通过下面的图来直观看到的整个流程的执行过程，非常值得参考学习。

再从从文档处理角度来看，实现流程如下：

这里需要注意，本项目未涉及微调、训练过程，但可利用微调或训练对本项目效果进行优化。

部署要求

软件要求

操作系统

Linux Ubuntu 22.04.5 kernel version 6.7

其他系统可能出现系统兼容性问题。

最低要求

该要求仅针对标准模式，轻量模式使用在线模型，不需要安装torch等库，也不需要显卡即可运行。

Python 版本: >= 3.8(很不稳定), < 3.12
CUDA 版本: >= 12.1

推荐要求

开发者在以下环境下进行代码调试，在该环境下能够避免最多环境问题。

Python 版本 == 3.11.7
CUDA 版本: == 12.1

硬件要求

如果想要顺利在GPU运行本地模型的 FP16 版本，你至少需要以下的硬件配置，来保证在我们框架下能够实现稳定连续对话

ChatGLM3-6B & LLaMA-7B-Chat 等 7B模型

最低显存要求: 14GB
推荐显卡: RTX 4080

Qwen-14B-Chat 等 14B模型

最低显存要求: 30GB
推荐显卡: V100

Yi-34B-Chat 等 34B模型

最低显存要求: 69GB
推荐显卡: A100

Qwen-72B-Chat 等 72B模型

最低显存要求: 145GB
推荐显卡：多卡 A100 以上

实际部署配置示例

处理器: Intel® Core™ i9 processor 14900K 内存: 256 GB DDR5显卡组:NVIDIA RTX4090 X 1 / NVIDIA RTXA6000 X 1硬盘: 1 TB操作系统: Ubuntu 22.04 LTS / Arch Linux, Linux Kernel 6.6.7显卡驱动版本: 545.29.06Cuda版本: 12.3 Update 1Python版本: 3.11.7

部署 Langchain-Chatchat

Docker 部署

开发组为开发者们提供了一键部署的 docker 镜像文件懒人包。开发者们可以在 AutoDL 平台和 Docker 平台一键部署。

docker run -d --gpus all -p 80:8501 isafetech/chatchat:0.2.10docker run -d --gpus all -p 80:8501 ccr.ccs.tencentyun.com/chatchat/chatchat:0.2.10docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.10

该版本镜像大小 50.1GB，使用 v0.2.10，以 nvidia/cuda:12.1.1-cudnn8-devel-ubuntu22.04 为基础镜像
该版本为正常版本，非轻量化版本
该版本内置并默认启用一个 Embedding 模型：bge-large-zh-v1.5，内置并默认启用 ChatGLM3-6B
该版本目标为方便一键部署使用，请确保您已经在 Linux 发行版上安装了 NVIDIA 驱动程序
请注意，您不需要在主机系统上安装 CUDA 工具包，但需要安装 NVIDIA Driver 以及 NVIDIA Container Toolkit

本地部署方案

安装python环境

# 首先，确信你的机器安装了 Python 3.8 - 3.10 版本$ python --versionPython 3.8.13
$ conda create -p /your_path/env_name python=3.8$ source activate /your_path/env_name
$ conda create -n env_name python=3.8$ conda activate env_name # Activate the environment
# 更新py库$ pip3 install --upgrade pip

安装项目相关的依赖

$ git clone --recursive <https://github.com/chatchat-space/Langchain-Chatchat.git>$ cd Langchain-Chatchat
# 安装全部依赖$ pip install -r requirements.txt
# 默认依赖包括基本运行环境（FAISS向量库）。以下是可选依赖：- 如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。- 如果要开启 OCR GPU 加速，请安装 rapidocr_paddle[gpu]- 如果要使用在线 API 模型，请安装对用的 SDK

模型下，如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Embedding 模型可以从 HuggingFace 下载。

$ git lfs install$ git clone <https://huggingface.co/THUDM/chatglm2-6b>$ git clone <https://huggingface.co/moka-ai/m3e-base>

初始化知识库,当前项目的知识库信息存储在数据库中，在正式运行项目之前请先初始化数据库

#如果您已经有创建过知识库$ python init_database.py --create-tables#如果您是第一次运行本项目$ python init_database.py --recreate-vs

一键启动，一键启动脚本 startup.py，一键启动所有 Fastchat 服务、API 服务、WebUI 服务

$ python startup.py -a

启动界面

正常启动后，会有两种使用界面，一种是webui，如下：

Web UI 知识库管理页面

另一种使用方式是API，以下是查看提供的API。

最轻模式

以上的部署方式是需要显卡的，对于我们这些没卡的一族来说，就很尴尬。但是项目很贴心，提供一个lite模式，该模式的配置方式与常规模式相同，但无需安装 torch 等重依赖，通过在线API实现 LLM 和 Ebeddings 相关功能，适合没有显卡的电脑使用。

$ pip install -r requirements_lite.txt$ python startup.py -a --lite

该模式支持的在线 Embeddings 包括：

智谱AI
MiniMax
百度千帆
阿里云通义千问

在 model_config.py 中将 LLM_MODELS 和 EMBEDDING_MODEL 设置为可用的在线 API 名称即可

总结

项目的结构非常不错，针对当前热门的AI知识库给出一种非常好的构建方式，而且还做到了全链条的开源产品，所以无论你是希望直接使用它来构建知识库，还是希望通过本项目学习和实现自己的解决方案，都会是非常好的选择。

我也建议大家不要单纯的伸手党，还是要自己去研究一下项目的架构，因为这类项目实际上最精华的就是架构设计

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-24

别再堆 Prompt 了：用 LangChain 1.0 搭建“深度思考 Agent”

2025-12-21

文档审核Agent2.0系统落地方案：LangChain1.1+MinerU

2025-12-21

LangChain、Dify、n8n、Coze框架对比

2025-12-20

涌现观点｜LangChain 2025 报告发布：57%的企业在用Agent，但32%的人被"质量"卡住了

2025-12-18

2025 LangChain智能体工程年度报告发布！AI智能体从画饼到吃饼

2025-12-17

智能体LangChain v1.0生态解读与迁移建议

2025-12-08

让AI智能体拥有像人类的持久记忆：基于LangGraph的长短期记忆管理实践指南

2025-12-04

Agentic RAG这样用LangChain解决复杂问题

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

不再搞Chain 设计的LangChain 1.0，与LangGraph有哪些区别？

2025-11-03

LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

2025-10-23

AI 不再“乱跑”：LangChain × LangGraph 打造可控多阶段智能流程

2025-10-19

LangChain v1.0正式版发布，5分钟快速上手实战

2025-11-06

Spring AI Alibaba/Dify/LangGraph/LangChain 一文讲清四大AI框架怎么选

2025-10-31

LangChain 1.0 全面进化指南

2025-11-05

LangChain 与 LangGraph 双双发布 1.0：AI 智能体框架迎来里程碑时刻！

2025-10-23

LangSmith+LangGraph本地化部署与离线调试全流程

2025-11-01

LangChain对话Manus创始人：顶级AI智能体上下文工程的“满分作业”首次公开

2025-10-15

为什么我们选择 LangGraph 作为智能体系统的技术底座？

2025-10-29

大家都在问

不再搞Chain 设计的LangChain 1.0，与LangGraph有哪些区别？

2025-11-03

为什么我们选择 LangGraph 作为智能体系统的技术底座？

2025-10-29

LangChain创始人：如何让AI智能体（Agent）跑得更快？

2025-07-14

“你问我答”，LangChain 是怎么帮 AI 变聪明的？

2025-07-13

一文看懂 LangChain：为什么火？核心模块都干啥？

2025-07-05

LangChain的OpenAI和ChatOpenAI，到底应该调用哪个？

2025-06-26

【LangChain 团队重磅实测报告】多智能体架构揭秘：谁才是性能之王？

2025-06-13

首个落地案例！WEBTOON 用 LangGraph 构建故事理解 Agent，创作者 AI 时代的范式来了？

2025-05-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean