微信扫码
添加专属顾问
我要投稿
GraphRAG:AI降本1000倍
今年7月,微软首次开源了庞大的知识索引框架GraphRAG,在短短四个月内,它便在GitHub上获得了超过19,000颗星,迅速成为RAG(图谱增强生成)技术领域的热门框架之一。尽管GraphRAG在许多场景中表现出色,但在处理全局数据查询时,其成本问题一直受到诟病,尤其是在大规模AI模型中,查询的延迟和准确性也成为了瓶颈。
为了解决这些问题,微软研究院在近日推出了GraphRAG的全新升级版——LazyGraphRAG。LazyGraphRAG的最大亮点在于其极低的成本,数据索引的开销仅为GraphRAG的0.1%。并且微软还采用了创新的混合数据搜索方法,使得生成结果的准确性和效率都有显著提升。LazyGraphRAG将很快以开源的形式加入GraphRAG库,进一步扩展其应用范围。
LazyGraphRAG的核心优势
低成本的数据索引
LazyGraphRAG的最大亮点在于其数据索引阶段的创新。传统的GraphRAG需要通过大型语言模型提取和描述实体及其关系,并为每个实体生成详细总结,这一过程导致了高昂的成本。而LazyGraphRAG则通过NLP名词短语提取技术,识别概念及其共现关系,再通过图形统计优化概念图,并提取分层社区结构。这样,LazyGraphRAG不仅保留了GraphRAG的强大功能,而且大幅降低了计算成本,其索引成本仅为完整GraphRAG的0.1%。
高效的查询处理
LazyGraphRAG采用了“懒惰”模式,结合了最佳优先搜索(Best-first Search)和广度优先搜索(Breadth-first Search)的优势。首先,按相似度排名文本片段,然后通过动态选择相关社区来逐步细化查询结果。相比传统的广度优先搜索,LazyGraphRAG能够更加高效地找到最佳匹配的文本块,同时考虑整个数据集的广度,极大地提高了查询的效率。
LazyGraphRAG的应用场景
中小企业与个人开发者
LazyGraphRAG特别适合对成本敏感的应用场景,尤其是中小企业和个人开发者。其快速且几乎免费的索引使其在内容推荐系统和项目管理工具等应用中,能够高效处理全局查询,同时保持低成本,极大降低了开发门槛。
一次性查询与探索性分析
LazyGraphRAG的灵活性使其在一次性查询和探索性分析场景中非常受欢迎。无需复杂的预处理和索引生成,用户可以快速获得查询结果,特别适合需要实时反应和快速获取答案的应用场景。
流式数据应用
LazyGraphRAG的扩展性和灵活性使其成为处理流式数据的理想工具。无论是数据实时更新还是持续变化,LazyGraphRAG都能高效、精准地提供查询答案,特别适合快速变化的业务环境。
LazyGraphRAG的性能评测
微软针对LazyGraphRAG的表现进行了三种不同预算下的详细评测:
1. 最低预算(100次相关性测试,低成本LLM)
在最低预算下,LazyGraphRAG在本地查询和全局查询中均显著优于其他方法,包括GraphRAG的全局搜索。尽管全局查询上GraphRAG表现较好,但LazyGraphRAG凭借其成本优势占据了上风。
2. 中等预算(500次相关性测试,使用更高级的LLM)
当预算提升到500次相关性测试时,LazyGraphRAG的表现进一步提升。其成本仅为GraphRAG C2级别的4%,但性能明显超越了所有竞争方法,尤其是在本地查询和全局查询方面。
3. 高预算(1,500次相关性测试)
在高预算下,LazyGraphRAG的胜率持续上升,尤其在全局查询上,其表现超越了其他所有方法,显示了LazyGraphRAG在成本和质量方面的强大可扩展性。
LazyGraphRAG的未来展望
尽管LazyGraphRAG在成本和质量上取得了巨大突破,微软仍然认为并非所有图形支持的RAG都应该采用LazyGraphRAG模式。微软的观点有三点:
GraphRAG的额外价值:GraphRAG的实体、关系和社区摘要数据索引具有超越问答的使用价值,例如可以用于报告生成和数据分析等其他应用。
结合优势:GraphRAG的索引结合LazyGraphRAG的搜索机制,可能会比单独使用LazyGraphRAG取得更优的结果。
新型数据索引:微软正在探索通过预先声明和主题提取等方式,设计一种支持LazyGraphRAG类似搜索机制的GraphRAG新型数据索引,旨在实现最佳效果。
微软计划继续在GraphRAG GitHub仓库中发布LazyGraphRAG的更新与进展,共同期待!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-20
谈谈RAG 的四个级别
2025-04-20
大模型能像专业分析师一样提取用户需求吗?
2025-04-19
基于Embedding分块 - 文本分块(Text Splitting),RAG不可缺失的重要环节
2025-04-19
RAG升级-基于知识图谱+deepseek打造强大的个人知识库问答机器人
2025-04-19
RAG vs. CAG vs. Fine-Tuning:如何为你的大语言模型选择最合适的“脑力升级”?
2025-04-19
低代码 RAG 只是信息搬运工,Graph RAG 让 AI 具备垂直深度推理能力!
2025-04-18
微软PIKE-RAG全面解析:解锁工业级应用领域知识理解与推理
2025-04-18
AI 记忆不等于 RAG:对话式 AI 为何需要超越检索增强
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-20
2025-04-19
2025-04-18
2025-04-16
2025-04-14
2025-04-13
2025-04-11
2025-04-09