我要投稿

图解RAG

发布日期：2024-10-08 21:36:04 浏览次数： 2493

作者：Qingwave

微信搜一搜，关注“Qingwave”

RAG(Retrieval-Augmented Generation, 检索增强生成)是一种将信息检索与生成模型结合的方法，也是企业落地大模型应用最常见的方式。

什么是RAG

RAG接受用户输入，从一个大型文档集合中检索相关信息，然后将用户问题与检索信息发送到大模型，大模型生成最终答案。

RAG可以借助外部知识源，从而提升回答的准确性和信息丰富度，相当于为LLM配置了一个书架，虽然有些知识不知道，但可以参考相关书籍从而获取不错的答案。可以用来做文档问答系统、客服系统、企业内私有数据的问答系统。

工作原理

基础RAG分为三个阶段Indexing、Retrieval与Generation:

「Indexing」

将知识库拆分成固定大小的块
选择合适的Embedding模型将数据块向量化，存放在VectorDB(向量数据库)中

「Retrieval」

当用户查询时，先将查询转换为向量
然后在VectorDB中匹配相关内容

「Generation」

将用户输入与检索信息填入Prompt发送给大模型
大模型返回结果

RAG范式

RAG应用根据复杂程度可分为三类：

Naive RAG(朴素RAG)
Advanced RAG(高级RAG)
Modular RAG(模块化RAG)

Naive RAG

Naive RAG遵循传统的RAG索引、检索和生成过程。简而言之，用户输入用于查询相关文档，然后这些文档与提示相结合并传递给模型以生成最终响应。如果应用程序涉及多轮对话交互，则可以将对话历史集成到提示中。

Naive RAG实现简单但有一些局限性，例如精度低（没有检索到相关片段）、召回率低（未能检索到所有相关片段）。

Advanced RAG

Advanced RAG在Naive RAG的基础上，通过一些技术手段提高了检索质量，涉及优化预检索、检索和后检索过程。

「预检索」优化了数据索引过程，方法包括：增强数据粒度、优化索引结构、添加元数据等。
「检索中」旨在提高检索的准确性，常见方法有：查询重写、多路召回、优化嵌入模型等。
「检索后」通过检查重排（Rerank）、上下文压缩等。

Modular RAG

Modular RAG整合了Advanced RAG的各种模块和技术，以改善整体的RAG系统。包括搜索、路由、内存、融合等模块，朴素RAG与高级RAG只是其中的特例。

RAG框架

目前比较流行的RAG框架有LlamaIndex与LangChain，可以根据使用场景选择合适的框架，当然这些框架也在不断发展。

LlamaIndex是一个构建大模型应用的数据框架，从名字可以看出专注于大模型应用数据处理，比如加载、索引、查询等。
LangChain是一个通用的大模型应用开发框架，使用模块化设计方便开发人员构建大模型应用，比如问答系统、智能客服、智能代理等。

RAG评估

RAG应用的流程较长，每一步都会影响到最终效果，那么怎么知道我的RAG应用哪里需要优化呢？这就需要用到RAG评估。

通过设置一些指标，常见的如Correctness(答案准确性)、Answer Relevancy（答案相关性）、Faithfulness（忠诚度）、Context Precision（上下文精度）等，来评估应用各个阶段的表现情况，可以人工打分也可以借助LLM来实现，根据打分结果来做对应的优化。

总结

本文总结了RAG应用的相关内容，包括原理、开发范式、常用框架以及评估等。当然RAG应用还面临了不少挑战，随着LLM的快速发展，RAG必定也会推陈出新。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-18

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-17

embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

2025-12-17

企业AI真瓶颈：不在模型，而在语境！

2025-12-17

从 1600+ 份 Word 文档到生产级 RAG：一个工控行业知识库的全链路实战复盘

2025-12-16

短语检索不等于BM25+向量检索｜ Milvus Phrase Match实战

2025-12-16

让AI真正懂数据：猫超Matra项目中的AI知识库建设之路

2025-12-10

最新力作：一招提升RAG检索精度20%

2025-12-10

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

2025-10-11

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

总结了 13 个顶级 RAG 技术

2025-10-12

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

RAGFlow 深度介绍

2025-10-31

RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025-11-13

任何格式RAG数据实现秒级转换！彻底解决RAG系统中最令人头疼的数据准备环节

2025-10-12

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

大家都在问

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

2025-12-10

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB