我要投稿

Dify+Ollama+Deepseek+BGE-M3来搭建本地知识库实操

发布日期：2025-04-03 21:39:22 浏览次数： 1769 作者：架构师炼丹炉

智能体(Al Agent)是大模型与业务应用的桥梁，智能体=大模型+知识库+业务系统API+工作流编排

第一步创建智能体应用

点击左侧“创建空白应用"，在如下界面中点击”Agent“。给名称和图标，创建完成。

第二步配置智能体的模型

点击上一步中创建好的智能体，点击去 "去设置"，就可以输入申请的API Key或者本地大模型。API key是指去deepseek等官网申请账号并获取一个key，但是这个会收费而且知识库内容会暴露在网上，不安全。

本文采用的是本地大模型，所以选择Ollama。

2.1 配置LLM

创建智能体的时候，可以通过"去设置"来添加模型，如下图，点击模型供应商然后点击Ollama下面添加模型按钮。

当然也可以点击右上角的账户名，然后在菜单里面点击设置，就可以打开上图的设置页面来添加或者维护模型。

事先我已经安装了Ollama并下载了几个大模型，如果大家没有事先准备好。那先下载安装Ollama，并在命令行工具里面下载运行大模型即可，简单的命令如下：

如果有必要，我可以再写一篇关于Ollama相关的文章，这里不再描述。然后在弹出页面中输入具体内容，如下红色箭头部分不能直接输入 http://localhost:11434

输入localhost，点击保存总是报错"An error occurred during credentials validation: HTTPConnectionPool(host='localhost', port=11434): Max retries exceeded with url: /api/chat (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f4a84ce0590>: Failed to establish a new connection: [Errno 111] Connection refused'))"。

问题主要出在docker类似于虚拟机，如果直接写 http://localhost:11434，其实访问的是docker本身的服务，肯定就找不到了。其实当前请求相当于docker要访问主机机器的地址，那就需要把主机的ollama地址暴露出来，步骤如下：

系统变量里面加 OLLAMA_HOST，然后输入局域网地址或者直接输入"0.0.0.0"; 如果是对外的网络地址也行。然后在path里面增加%OLLAMA_HOST%，重启Ollama即可。

2.2 配置知识库Embedding模型

逻辑推理用deepseek大模型, 知识库Embedding不用deepseek，说命中率不高，回答问题效果不好，所以选用BGE-M3。按如下红色箭头命令操作，然后查看一下，模型已经下载完成。

BGE (BAAI General Embedding) 专注于检索增强LLM领域，对中文场景支持效果更好，当然也有很多其他embedding模型可供选择，可以根据自己的场景，在ollama上搜索“embedding”查询适合自己的嵌入模型。

配置如上图，如果说连不上报错，要确认Ollama是否启动，就直接在浏览器里面输入URL看看是否有“Ollama is running”字样。点击保存按钮，就可以看到如下所示LLM用了deepseek-r1:14b而TEXT EMBEDDING用的是bge-m3。

至此，两个模型配置完成。

第三步知识库操作

3.1 创建知识库

如下图操作

3.2 上传RAG资料

可以看到有三步，即选择数据源，文本分段与清洗，处理并完成。资料可以是本地的文本文件，或者直接同步网络资料等等。

支持的文本文件类型也很多，不过要注意单个文件不能超过15M。如果文件大了怎么办，拆呗。

3.3 保存资料并处理

我上传了一个自己写的用户手册，pdf格式，12.86M，可以处理。点击下一步，如下图。

分段设置直接用了通用的，索引方式用高质量，Embedding模型用bge-m3，检索设置用混合检索。点击保存并处理，等待处理完成。

完成前往文档，知识库里面就有一个文档知识库内容了。

第四步测试结果

点击工作室，并打开已经创建完成的智能体(Agent)

不错，AI能够自己检索并拼出结果给用户。接下来要研究怎么改进RAG，并嵌入到自己写的系统中。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-28

DeepSeek本地部署（局域网+异地访问）数据库（保姆教程）

2025-04-28

milvus 三种部署方式说明

2025-04-28

使用CAMEL实现Graph RAG过程记录

2025-04-28

Graphiti-构建适用于 AI 智能体的实时知识图谱

2025-04-28

GraphRAG在企业知识服务中的应用落地

2025-04-27

知识图谱增强的合规医学大模型产学研新范式探索

2025-04-26

知识图谱

2025-04-26

面向产业链投研的智能知识图谱研究探索

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

喂饭教程！全网首发Neo4J可视化GraphRAG索引

2024-07-17

知识图谱+AI：如何构建一个Graph RAG App？

2025-01-02

全网首发！小白也能读懂的GraphRAG知识图谱全流程解析，多图预警！

2024-08-13

Knowledge Graph Studio：让知识图谱构建更简单、更智能

2025-01-03

十大向量数据库怎么选？AI/RAG应用开发技术参考

2024-08-27

手把手教你构建基于知识图谱的GraphRAG之结构化数据篇【LangChain+Neo4j】

2024-07-11

论文浅尝 | 揭开思维链、思维树和思维图的神秘面纱

2024-06-24

大语言模型和知识图谱结合的知识库（开篇）

2024-07-13

理解图结构和图推理，彻底掌握GraphRAG底层逻辑，悄悄超越99%的人 | ICLR2024

2024-07-12

两个基于大模型的知识图谱自动构建开源工具：兼看AutoKG轻量化关键词KG构建和混合增强问答思路

2024-06-10

大家都在问

LLM如何将杂乱文本变为可视化知识图谱？

2025-04-20

微软Phi-4-mini：小模型如何在GraphRAG中大放异彩？

2025-04-15

LLM知识图谱构建器：前端架构如何革新数据可视化？

2025-04-09

RAG知识库的数据方案：图数据库、向量数据库和知识图谱怎么选？

2025-03-29

DeepSeek+知识库，是智能体还是高级搜索引擎？

2025-02-13

向量数据库真的能满足所有 AI Agent 的记忆需求吗？

2025-01-14

如何用GraphRAG + GNN解锁知识图谱的隐藏价值？

2025-01-10

搭建一个本地AI知识库需要用到哪些技术栈？

2025-01-06

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部