我要投稿

有效果！1万份PDF！做知识库+知识图谱！纯本地Qwen2生产！高并发+可拓展！番外3-2

发布日期：2024-06-30 10:48:35 浏览次数： 2948

作者：一意AI增效家

微信搜一搜，关注“一意AI增效家”

今天！内容非常简单！

#1 做知识图谱！把N份PDF，给本地大模型做！

#2 接入RAG系统！用知识图谱提升性能！

提问：“卖油翁的作者是谁？”

大模型学习知识图谱后，回答：

卖油翁的作者是欧阳修。根据提供的文本信息，“《卖油翁》 -> Written by -> 欧阳修”明确指出《卖油翁》是由欧阳修所写。此外，文本中也提到“《卖油翁》写作背景是宋英宗治平四年（1067年），欧阳修遭飞语中伤，自请外任，在出知亳州时作该文”，进一步证实了这一点。因此，可以确定卖油翁的作者是欧阳修!

它背后，三大板块在工作！大模型+知识图谱+RAG！

大模型后端：VLLM高速推理Qwen2！

知识图谱：毫秒级nebulagraph

RAG框架：llama-index

还没看到上一篇环境搭建的，一定要返回去看！搭建有问题的，一定要解决！在这里学搭建！

提升RAG性能！接入知识图谱！结合nebulagraph，生产+AI拓展两相宜！番外3

今天，就是跑代码的！现在打开雄哥上传的代码文件！跟着对照！

如果你还没获得，直接到末尾找工程师-小胖！报 “老粉” 加入！

嫌麻烦的，直接识别二维码申请！

人的专注力只有10分钟，那！话不多说！

① 进入环境及依赖说明

② VLLM推理Qwen2！高并发，快生产！

③ 加载本地数据并构建知识图谱

④ 接入Llama-index，增强检索！

许多依赖，只有linux版本，所以，win系统的朋友，你要换个电脑/系统跑了！公司生产，一般都是Linux！如果不是你的菜，马上可以关闭。

接下来！跑起来！一边跑，一边聊细节！

第一部分：进入环境及依赖说明

书接上一回！

你进入了jupyter环境，整体就是跟着代码，点一遍运行就行！

非常简单！

但，今天是想告诉你，雄哥没有在代码注解的细节！完整代码，一定要自己实操！

先把依赖装完！

!pip install llama-index-llms-vllm!pip install llama-index!pip install ipython-ngql!pip install vllm%pip install nebula3-python%pip install llama-index-graph-stores-nebula%pip install llama-index-embeddings-huggingface%pip install llama-index-embeddings-instructor%pip install jupyter-nebulagraph

有几个包，这里说一下！

这个包，是我们在jupyter链接知识图谱的拓展，没装的话，用不了啦！

ipython-ngql

安装VLLM！

高速推理框架！本次，我们直接在jupyter上推理！

vllm

你可能遇到的最多安装问题，就是这里，本地环境，依赖难倒很多人！

注意自己的cuda、pytorch、gcc版本！

基本做法，就是缺啥补啥，如果补了还不行，一定要找小胖！

第二部分：部署本地Qwen2+text2vec

非常简单，如果你本地就有大模型，没有的！去会员盘下载！

直接把你存放本地的model路径，粘贴到代码块中，即可！

要绝对路径！不能有中文！

from llama_index.llms.vllm import Vllm
llm = Vllm(model="/media/auys/AI/models/glm-4-9b-chat",dtype="float16",tensor_parallel_size=1,temperature=0,max_new_tokens=100,vllm_kwargs={"swap_space": 1,"gpu_memory_utilization": 0.9,"max_model_len": 8192,},)

雄哥设置了参数0.9，上下文8192！看到这样，就说明启动成功！

看一下资源情况！加上向量模型，GPU占用约23G！

VLLM是一个大模型的推理框架，支持高并发！还不知道怎么部署，看这！

给本地大模型装氦气！高并发！推理速度翻NNN倍！Qwen+ChatGLM+Yi等全支持！接fastgpt！Vllm喂饭到嘴！

设置默认工作大模型！

这里我们设置了qwen2-7b+text2vec-large-chinese！

from llama_index.core import Settings# 把加载的模型添加到环境设置中，定义全局模型
Settings.llm = llmSettings.embed_model = embed_mode

第三部分：加载本地数据并构建知识图谱

这里，支持无数份PDF，当然！数据越多，处理时间越长！

加载数据后！把数据推给大模型，让大模型自行构建节点+关系！

最后，写入星云图中！

雄哥在网上找了一个示意图，大概就这样！

导入PDF数据文件夹！

这个文件夹，要把所有的pdf文件，都放在里面！然后把路径，填到下图！

系统会全部加载！

documents = SimpleDirectoryReader("/home/auys/agent_tools/datasets").load_data()

创建知识图谱空间！

如果你已经有了知识图谱，就不用创建了！没有就要创建！

名字是：llamaindex_nebula_property_graph 256的FIXED_STRING类型！

%ngql CREATE SPACE IF NOT EXISTS llamaindex_nebula_property_graph(vid_type=FIXED_STRING(256));

这里，要等10秒，再开始下一步，会有延迟，没建好，就干不了下一步！

越复杂的集群，时间可能越久！

把知识图谱接入RAG！

这里，只是接入，后面我们要让大模型生成节点，让知识图谱的内容，成为上下文，达到开头效果！

from llama_index.graph_stores.nebula import NebulaPropertyGraphStore# 加载刚刚创建的知识图谱，如果你之前创建过，把名称改一下graph_store = NebulaPropertyGraphStore(space="llamaindex_nebula_property_graph", overwrite=True)

把PDF做成知识图谱+向量！

这里！可以指定他输出一个知识图谱的json文件！想存到哪，自己改！

index = PropertyGraphIndex.from_documents(documents,property_graph_store=graph_store,vector_store=vec_store,show_progress=True,)

打印看看成果！

这里，雄哥打印了1000个节点看看！

%ngql MATCH p=(v:Entity__)-[r]->(t:Entity__) RETURN p LIMIT 1000;

看一下这些图谱！

%ng_draw

到这里！知识图谱就搞掂了！

你也可以在刚刚我们安装的前端，进到系统，就可以看到啦！

那怎样去接入RAG系统中？增强我们检索！

第四部分：接入RAG

到了这！

雄哥创建了一个query_engine查询引擎！这是最基本的设置！

你可以在这个基础上拓展，甚至实现多跳查询+意图识别等复杂功能！

需要的也可留言！

回到我们代码，雄哥输入提问，他会先去知识图谱检索相似图，然后把这个些关系，发给大模型，让大模型根据图谱关系，回答！

query_engine = index.as_query_engine(include_text=True)
response = query_engine.query("卖油翁的作者是谁？")
print(str(response))

先发一个问题！

query_engine.query("卖油翁的作者是谁？")

大模型的回答！

卖油翁的作者是欧阳修。根据提供的文本信息，“《卖油翁》 -> Written by -> 欧阳修”明确指出《卖油翁》是由欧阳修所写。此外，文本中也提到“《卖油翁》写作背景是宋英宗治平四年（1067年），欧阳修遭飞语中伤，自请外任，在出知亳州时作该文”，进一步证实了这一点。因此，可以确定卖油翁的作者是欧阳修。

我们看看他背后，检索到什么图谱关系！

retriever = index.as_retriever(include_text=False,# 这是返回原文，设置为True，如果要让知识图谱根据问题返回节点，设置为False)
nodes = retriever.retrieve(  "卖油翁的作者是谁？")

这里，让他返回检索到的节点关系！

如果设置True，会检索返回原文！

ok！

做完这篇知识图谱的板块，是给有需要的会员，一个交代了！

之前，雄哥就跑过如何制作知识图谱，今天把它在生产的角度，做出来！

并且接入RAG系统中，发挥知识图谱的价值！

这下，我们专心搞Agent项目！

就聊这么多！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-01

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

爆改RAG！让你的AI检索“见人说人话，见鬼说鬼话”——自适应检索的魔法揭秘

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-06-30

EraRAG：突破传统GraphRAG限制，实现动态语料库的高效检索增强生成

2025-06-30

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

RAG搭建个人LLM知识库助手，很多人第一步就走错了...

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地化大模型接入RagFlow错误记录

2025-04-13

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

RAGFlow如何实现图片问答：原理分析+详细步骤（附源码）

2025-04-09

MCP与RAG，and 让我们用MCP的Tool莽穿一切！

2025-04-16

深度解读：LlamaIndex 实现 RAG 重排序的关键要点

2025-05-08

老码小张实测：GitMCP 太神了！一行 URL 让 AI 秒懂你的 GitHub 项目

2025-04-05

RAG进阶：Embedding Models嵌入式模型原理和选择

2025-04-23

MCP + 数据库，一种比 RAG 检索效果更好的新方式！

2025-04-08

构建Agentic RAG 系统的方法有哪些？

2025-04-09

旺精通~智能体检索增强生成(Agentic RAG)综述：背景、模型、框架、测试、展望

2025-04-10

大家都在问

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-07-01

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

你的RAG系统安全么？

2025-06-29

RAGFlow实战：如何根据文档类型选择最佳切片策略？

2025-06-20

为什么说『RAG开箱即用』是最大的AI技术谎言？

2025-06-19

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB