我要投稿

最佳实践｜本地跑GraphRAG

发布日期：2024-09-07 07:18:07 浏览次数： 2912 作者：老贾探AI

为在本地环境中部署GraphRAG，需配置两种模型：一是用于实体提取与摘要的LLM（大型语言模型），二是用于数据向量化的Embedding模型。当前，GraphRAG采用的是OpenAI提供的模型，故部署的核心在于选用兼容OpenAI API标准的模型以实现替代。今天带大家一起沉浸式体验本地运行GraphRAG，并且在支持中文graph构建上做了一些优化改进。

点关注

不迷路

一、准备环境

Python3.10 (推荐)
Pycharm
Qwen2-72B-Instruct (LLM 模型)
bge-m3 (Embedding 模型)
Xinference (Embedding 模型部署平台)
3090 服务器 (Embedding 模型运行服务器)

二、pip安装

pip install graphrag

三、准备数据

首先，创建 input 目录：

mkdir -p ./ragtest/input

随后，将文本材料放到 input 目录下。注意 GraphRAG 仅支持 txt 文件，编码格式必须为 utf-8。我这里选用《红楼梦》中，林黛玉初入荣国府一节。

由于篇幅过长，具体文件已放在云盘【若需要私信关键词：2024001】

也可以使用官方提供的英文材料：

curl https://www.gutenberg.org/cache/epub/24022/pg24022.txt > ./ragtest/input/book.txt

四、初始化配置文件

首先，运行工作区初始化命令：

python -m graphrag.index --init --root ./ragtest

这一命令将在 ./ragtest 目录中创建两个文件：.env 和 settings.yaml

.env 包含运行 GraphRAG 管道所需的环境变量。如果检查该文件，您将看到定义的单个环境变量 GRAPHRAG_API_KEY=<API_KEY> 。这是 OpenAI API 或 Azure OpenAI 终结点的 API 密钥。因为我们将要替换掉 OpenAI 模型，所以不用对其进行操作更改。
settings.yaml 包含管道的设置。我们需要在其中对两个模型的设置进行更改，这里截取更改了的 LLM 和 Embedding 部分：

llm:
  api_key: ${GRAPHRAG_API_KEY}
  type: openai_chat # or azure_openai_chat
  model: Qwen2-72B-Instruct
  model_supports_json: false 
  max_tokens: 2000
  # request_timeout: 180.0
  api_base: http://11.0.0.1:8000/v1 # 根据部署的实际情况进行更改
  tokens_per_minute: 30000
  requests_per_minute: 30 
  top_p: 0.99 # top-p sampling
embeddings:
  ## parallelization: override the global parallelization settings for embeddings
  async_mode: threaded 
  llm:
    api_key: xinference
    type: openai_embedding 
    model: bge-m3
    api_base: http://10.0.0.1:9998/v1 # 根据部署的实际情况进行更改

其中，Embedding 模型用 Xinference 在 3090 服务器上运行了 bge-m3，部署和运行参考：Docker 镜像 — Xinference【https://github.com/alibaba/xinference】

另外，为了适配我们模型的参数，使得局部搜索有输出，需要把 local search 部分的 max_tokens 调小，可以选取 4000。

五、支持中文-优化改进

由于微软 GraphRAG 初始语言为英文，因此如果要运行中文文本，建议做出一定的改进措施。

优化1： 文档切分策略

替换 graphrag/index/verbs/text/chunk/strategies/tokens.py 即可。官方分块把文档按照 token 数进行切分，对于中文来说容易在 chunk 之间出现乱码，参考 Langchain-ChatChat 开源项目中用中文字符数进行切分。

由于篇幅过长，具体实现已放在云盘【若需要私信关键词：2024002】

优化2： prompt优化

原本的四个 prompt 都由英文书写，并要求 LLM 使用英文输出。为了更好地运行中文内容，把四个 Prompt 翻译成中文，且要求中文输出。

由于篇幅过长，精心翻译的中文 prompt 文件已放在云盘【若需要私信关键关键词：2024003】

六、索引构建

python -m graphrag.index --root ./ragtest

提示：All workflows completed successfully 后，即可进行查询。

七、测试查询

global 全局查询：

python -m graphrag.query --root ./ragtest --method global "故事的主旨是什么？"

local 本地查询：

python -m graphrag.query --root ./ragtest --method local "贾母对宝玉的态度怎么样？"

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-27

AI 写代码总是翻车？Upstash 创始人怒推 Context7：给 LLM 喂上最新鲜的官方文档。

2025-04-26

葵花宝典之「知识库」调优秘籍！RAG优化指南！

2025-04-26

RagFlow文档解析过程分析

2025-04-26

深度学习！构建基于LangGraph的RAG多智能体研究工具。

2025-04-26

用RAG与Agent提升企业问答效率：我的AI实践之路

2025-04-26

理解 RAG 第一部分：为什么需要它

2025-04-26

理解 RAG 第三部分：融合检索与重新排序

2025-04-26

理解 RAG 第四部分：检索增强生成评估框架

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB