我要投稿

搭建一个本地AI知识库需要用到哪些技术栈？

发布日期：2025-01-06 19:12:36 浏览次数： 2348 作者：测试蔡坨坨

随着AI热度愈发火热，越来越多的产品在AI的“赋能”下不断革新和进化。

AI技术的飞速发展不仅改变了人们的生活方式，也大大提升了各行各业的生产效率和创新能力。

在此背景下，我们不妨自己动手丰衣足食，搭建一套属于自己的本地的AI ChatBot？顺便学习下“高大上”的AI技术，亲身体验和把握这股“科技潮流”？

本篇，我们将通过全局的视角来看一下 “基于本地上传的文档进行QA问答” 类似的案例，需要学习哪些知识点以及会用到哪些技术栈。

框架

目前，根据我所了解到的知识，市面上深层次的ChatBot主流实现框架基本都是大同小异。

本地大模型 + LangChain + 前端界面

结合RAG框架：上传本地文件 + 文件切片 + Embedding向量编码 + LLM大语言模型

整体流程图

doc flow 文档处理流程

首先，从本地加载文档（upload & loader），比如：pdf、txt、csv、md等
从许多不同来源加载文档，LangChain提供了100多种不同的文档加载器。
加载完成后，对文档进行处理，提取文档信息
提取完文档信息后，进行文本切分

为什么要切分文本？
因为有时候我们的文档内容比较多，比如一本书，这种情况下不可能一次性去处理，就需要将文本切成一块一块的，分块处理。
如何进行合理切分？
我们通常希望将主题相同的文本片段放在一块。例如，Markdown文件是由h1、h2、h3等多级标题组织的，我们可以根据Markdown标题分割文本内容，把标题相同的文本片段组织在一块。借助LangChain的MarkdownHeaderTextSplitter文本切割器实现。

文档切割后得到文本块
对切割完成后的文本块进行Embedding向量编号
Embedding这里我们会用到很多模型，比如可以调用OpenAI的接口（收费），还可以用HuggingFaceHub（免费）等。
将所有文本的编码全部存储到向量数据库中
例如：Faiss、Pinecone、Chroma、Milvus等。

token flow 用户提问&AI回答

用户进行提问，输入一个问题
对用户输入的问题进行Embedding编码
将用户输入的向量与数据库中所有的向量进行相似性计算，即用户的提问跟数据库里哪些文本的相关性最高
文本召回，把达到某一个阈值的相关文本全部召回
将召回的文本结合问题，形成一个上下文的模板
基于上下文模板向大模型LLM提问
获取到我们想要的答案

优点

这种实现方式有什么好处呢？

我们可以让大语言模型在回答问题的时候是基于我们提供的文档范围去回答，减少AI幻觉，避免一本正经的胡说八道。
大语言模型可能信息更新不及时，基于我们提供的文档去回答，也解决了信息不及时的问题。

以上，完。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-15

知识库优化之路（三）：嵌入模型的选择和使用方法

2025-04-15

微软Phi-4-mini：小模型如何在GraphRAG中大放异彩？

2025-04-14

MCP技术革命：元控制协议如何重构AI与数据库的交互范式

2025-04-13

用大模型构建企业级知识图谱真的太简单了！

2025-04-13

深入解析 GreptimeDB MCP：连接数据库与 LLM 的桥梁

2025-04-13

GraphRAG的100%！把Agent接入知识图谱，自主精准找到数据！与LangGraph融合最终形态！day1

2025-04-09

LLM知识图谱构建器：前端架构如何革新数据可视化？

2025-04-07

解决Dify与Milvus集成难题：从零到一的实战避坑指南

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

知识图谱+AI：如何构建一个Graph RAG App？

2025-01-02

喂饭教程！全网首发Neo4J可视化GraphRAG索引

2024-07-17

全网首发！小白也能读懂的GraphRAG知识图谱全流程解析，多图预警！

2024-08-13

Knowledge Graph Studio：让知识图谱构建更简单、更智能

2025-01-03

手把手教你构建基于知识图谱的GraphRAG之结构化数据篇【LangChain+Neo4j】

2024-07-11

十大向量数据库怎么选？AI/RAG应用开发技术参考

2024-08-27

论文浅尝 | 揭开思维链、思维树和思维图的神秘面纱

2024-06-24

大语言模型和知识图谱结合的知识库（开篇）

2024-07-13

理解图结构和图推理，彻底掌握GraphRAG底层逻辑，悄悄超越99%的人 | ICLR2024

2024-07-12

两个基于大模型的知识图谱自动构建开源工具：兼看AutoKG轻量化关键词KG构建和混合增强问答思路

2024-06-10

大家都在问

微软Phi-4-mini：小模型如何在GraphRAG中大放异彩？

2025-04-15

LLM知识图谱构建器：前端架构如何革新数据可视化？

2025-04-09

RAG知识库的数据方案：图数据库、向量数据库和知识图谱怎么选？

2025-03-29

DeepSeek+知识库，是智能体还是高级搜索引擎？

2025-02-13

向量数据库真的能满足所有 AI Agent 的记忆需求吗？

2025-01-14

如何用GraphRAG + GNN解锁知识图谱的隐藏价值？

2025-01-10

搭建一个本地AI知识库需要用到哪些技术栈？

2025-01-06

知识图谱+AI：如何构建一个Graph RAG App？

2025-01-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部