我要投稿

LightRAG为什么好用又便宜

发布日期：2024-10-16 20:37:51 浏览次数： 2150 作者：LLM榴莲猫

LightRAG最近挺火，

它将图谱结构整合到文本索引和检索过程中，解决了传统RAG系统在处理复杂实体关系和上下文连贯性方面的不足。

这听上去很熟悉，和GraphRAG很像。

但LightRAG屌在哪里呢？有两个地方：

- 双层检索结构，底层提取细分实体，高层提取整体关系

- 增量更新算法，不需要更新整个索引

先说第一点：

举个例子，我想知道，苹果的营养价值是什么？

这一步LightRAG和GraphRAG大致相同。

它们首先将所有源文档拆分为较小的文本块，使用大型语言模型提取其中的实体（如“苹果”、“维生素C”、“膳食纤维”）及其关系（如“苹果富含维生素C”）

不同就在于后面的处理：

针对用户查询，LightRAG这里会分为两步：

低层检索，针对查询中的具体实体（如“苹果”、“营养”），从知识图谱中检索相关的具体信息和关系。

高层检索，针对查询的整体主题（如“苹果的营养价值”），检索更广泛的主题和概念。

然后将低层和高层检索到的信息整合在一起，形成一个全面的知识基础，LLM基于整合后的信息生成连贯且上下文相关的回答。

而GraphRAG之前我仔细讲过，它会将知识图谱划分为多个社区，每个社区代表一组紧密相关的实体和关系。

例如，一个社区可能专注于“苹果的维生素C含量”，另一个社区则聚焦于“苹果的膳食纤维益处”。

它针对用户查询，识别相关社区摘要，将所有部分回答进行归约总结，生成最终的全局回答。

双层检索让LightRAG能够直接整合信息，而GraphRAG要等所有社区摘要生成之后才能总结信息。

这就是LightRAG的创新之处，别小看这一点，实际上能节省很多成本。

第二点：

LightRAG支持快速适应新数据，无需重建整个索引。

这对企业或者法律、新闻等等数据频繁更新且需要快速适应新信息的领域来说简直是神器。

而GraphRAG需要重构整个社区关系，效率相对较低。

实测：

这里我用colab跑了一次LightRAG，数据用的是民?典全文：

全文9万多字，一共花了0.1刀，用的是4omin：

- 生成了66个文本块

- 从66个块中提取了1102个实体和439个关系(包括重复)

- 最终插入了743个唯一实体向量和392个唯一关系向量（这里LightRAG会对实体和关系进行去重）

- 最终构建了一个包含745个节点和392条边的图。

询问：

我老公没有经过我的同意买了一辆100万的豪车，这算不算我的负债，列名详细的法律依据条例？

LightRAG的回答跨越了婚姻法的领域，全面地引用了法典三处的条例，不仅有实体的细节（底层），也有全面的考虑（高层检索）

作为对比我用扣子，直接把文档作为知识库嵌入，得到的回答只是简单索引了一条，缺少全面的理解和概述：

假设我要增加一条条例：

夫妻之间每天都要一起吃饭，否则共同财产就自动由儿女继承。

这里看到插入的速度很快，从代码可以看到并没有重启整个文档的索引和重构，只是添加了实体数量和关系数量。

问：

夫妻之间有没有什么特别奇怪的条例？

回答：

。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

深度学习！构建基于LangGraph的RAG多智能体研究工具。

2025-04-26

用RAG与Agent提升企业问答效率：我的AI实践之路

2025-04-26

理解 RAG 第一部分：为什么需要它

2025-04-26

理解 RAG 第三部分：融合检索与重新排序

2025-04-26

理解 RAG 第四部分：检索增强生成评估框架

2025-04-26

理解 RAG 第五部分：管理上下文长度

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

【Ragflow】21.RagflowPlus(v0.2.1)：6个bug修复/增加重置密码功能

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB