我要投稿

LightRAG - 更快更便宜的GraphRAG

发布日期：2024-12-01 17:26:48 浏览次数： 2170

作者：TechLead

微信搜一搜，关注“TechLead”

检索增强生成（Retrieval-Augmented Generation, RAG）已经成为提升大型语言模型（LLMs）能力的重要方法之一，通过整合外部知识，显著改善了生成内容的质量和相关性。

RAG 的局限性

传统的 RAG 系统虽然表现优异，但其局限性也不容忽视：

数据结构扁平化 传统 RAG 系统往往依赖扁平化的数据结构，难以捕捉信息之间的复杂关系。这种缺陷导致生成的答案片段化，缺乏上下文的一致性。
有限的上下文意识 系统在处理需要综合多个数据点的复杂问题时表现不佳，生成的答案缺乏对数据间相互关联的全面理解。

GraphRAG的局限性

GraphRAG 通过使用 知识图谱 对文本中的实体和关系进行结构化建模，从而能够捕捉信息间的复杂关联。GraphRAG 首先在整个私有数据集上创建实体和关系的引用，随后采用自底向上的聚类方法，将数据层次化地组织为语义簇。然而，当数据集中加入新的知识时，GraphRAG 必须重新执行整个图构建流程。这种方式对于动态更新的数据集来说效率低下且成本高昂。

资源需求高：需要大量 API 调用（通常依赖昂贵的模型如 GPT-4o）。
数据更新昂贵：每次更新数据时，必须重建整个图谱。

LightRAG的创新点

相比之下，LightRAG 的增量更新机制大大简化了流程。它通过简单的 联合操作（union operation），将新的图节点和边直接添加到现有图谱中。这种方式避免了重复构建图谱的高昂开销，同时确保知识库实时更新，适应动态数据需求。

LightRAG

LightRAG 的核心卖点在于 基于图的索引 和 双层检索框架。以下是对这两个关键功能的深入解析：

Graph-based Indexing 基于图的索引

以下是 LightRAG 进行基于图索引的步骤：

实体与关系（ER）提取实体与关系提取由图中的 R(.) 表示。此步骤确保从给定文档中首先提取简单的实体。例如，在上图的示例中，“蜜蜂”（bees）和“养蜂人”（beekeeper）是两个实体，它们通过“观察”（observe）关系相关联，即养蜂人观察蜜蜂。
使用 LLM 生成键值（KV）对使用简单的 LLM 生成键值对。LLM 的分析步骤为实体或关系提供了简要的说明或解释。例如，在所选示例中，LLM 解释了“养蜂人”是谁。此步骤在图中由 P(.) 表示。需要注意的是，此 LLM 不同于主 RAG 流程中使用的通用 LLM。
去重鉴于文档内容与蜜蜂相关，实体“养蜂人”可能从多个文档或文本块中被多次提取。因此，需要一个去重步骤，仅保留一个具有相同含义的实体，丢弃其他重复项。此步骤在图中由 D(.) 表示。

Dual-level Retrieval 双层检索框架

对 RAG 系统的查询可以分为两种类型——具体的或抽象的。在同样的蜜蜂示例中，具体查询可能是：“一个蜂巢中可以有多少只蜂王？” 抽象查询可能是：“气候变化对蜜蜂有哪些影响？” 为了应对这种多样性，LightRAG 采用了两种检索方式：

低层检索：简单地提取精确的实体及其关系，如蜜蜂（bees）、观察（observe）和养蜂人（beekeepers）。

高层检索：通过使用 LLM，LightRAG 聚合信息并总结多个信息来源。

架构意义

进行这些操作并切换到 LightRAG 的确能改进执行时间。在索引过程中，每个文本块只需调用一次 LLM 来提取实体及其关系。

同样，在用户查询时，仅使用与索引相同的 LLM 从文本块中检索实体和关系。这大大减少了检索的开销，从而降低了计算成本。因此，最终拥有了一个“轻量”的 RAG！

将新知识整合到现有图谱中看起来是一个无缝的操作。与其在有新信息时重新索引整个数据，可以简单地将新知识附加到现有图谱中。

评估

评估中，LightRAG 与 Naive RAG、RQ-RAG、HyDE 和 GraphRAG 进行了比较。为了保持比较的公平性，统一使用了 GPT-4o-mini 作为 LLM，并在所有数据集上采用固定的分块大小（1200）。答案的评估标准包括全面性、多样性以及回答用户问题的有效性。

正如下划线结果所示，LightRAG 超越了当前所有最先进的方法。

总体而言，得出了以下结论：

使用基于图的方法（如 GraphRAG 或 LightRAG）相比基础的 Naive RAG 有显著改进。
LightRAG 通过双层检索范式生成了相当多样化的答案。
LightRAG 能够更好地处理复杂查询。

结论

尽管 RAG 是一种相对较新的技术，但这一领域正在快速发展。像 LightRAG 这样的技术可以将 RAG 流程引入廉价的通用硬件，这是非常受欢迎的。尽管硬件领域不断进步，但始终需要在计算受限的硬件上实时运行 LLM 和 RAG 流程。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-12

OpenAI 无需向量化的RAG新范例：探索大模型时代的高效知识问答与模型选择之道

2025-07-11

Rag评估框架

2025-07-11

详解RAG评估指标与评估方法

2025-07-11

一文读懂GraphRAG：把知识图谱塞进RAG，AI从“聪明”走向“懂事”

2025-07-11

文档太长模型“吃不下”？试试这15种Chunking策略，轻松搞定RAG！

2025-07-10

Spring Ai RAG 技术让大模型回答更精准

2025-07-09

5分钟了解GraphRAG和Mem0

2025-07-09

AI大模型落地最后一公里：RAG？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

MCP与RAG，and 让我们用MCP的Tool莽穿一切！

2025-04-16

深度解读：LlamaIndex 实现 RAG 重排序的关键要点

2025-05-08

RAG进阶：Embedding Models嵌入式模型原理和选择

2025-04-23

RAG技巧与底层代码剖析

2025-06-06

深度拆解RAGFlow分片引擎之切片实现

2025-04-16

2025年GitHub上十大RAG框架深度解析：从技术原理到实战应用

2025-05-30

淘天⾃营质量技术AI智能体的实践和思考

2025-05-19

Open WebUI中调用RAGFlow的聊天机器人——适合构建个人和企业级知识问答助手

2025-04-14

RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析

2025-06-05

大家都在问

AI大模型落地最后一公里：RAG？

2025-07-09

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-07-01

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

你的RAG系统安全么？

2025-06-29

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部