我要投稿

从0-1构建一个RAG（检索增强）系统

发布日期：2024-08-03 22:07:23 浏览次数： 2781

作者：AI研习所

微信搜一搜，关注“AI研习所”

昨日，Openai 推出Searchgpt,将 AI 与实时网络信息结合提供生成式UI结果.其背后的技术就是RAG. RAG（Retrieve Augment Generation，检索增强）是“驯服”大语言模型的主要手段之一。它允许大语言模型在从固定的数据库中抽取相关内容的基础上生成答案，从而限制随意发挥，提升答案的可靠性。

核心组件：

RAG(检索增强生成)系统的核心组件主要包括以下三个部分:

检索(Retrieval)组件:负责从外部数据源或知识库中获取与用户查询相关的信息。包括对输入查询的理解和解析,以及使用索引和检索算法从文本数据中提取相关内容。检索的质量和效率直接影响生成文本的准确性和相关性。

增强(Augmentation)组件:处理检索到的信息,将其与原始查询结合,形成丰富的上下文。可能涉及数据清洗、分块和使用嵌入模型等优化技术。目的是为生成模型提供更全面、准确的信息基础。

生成(Generation)组件:通常是一个大型语言模型(LLM)。利用检索和增强阶段提供的信息作为上下文。生成符合用户需求的自然语言文本或回答。

检索组件首先从知识库中获取相关信息。增强组件处理和整合这些信息。生成组件最后利用这些增强的信息来生成最终的输出。RAG系统的优势在于它结合了信息检索的准确性和自然语言生成的灵活性,能够提供更准确、相关和知情的回答,特别是在处理需要最新或专门知识的查询时。

构建过程：

文档处理

开发 RAG 系统的第一步是准备文档。这些文档将作为系统的基础数据。

文本提取

接下来，使用 OCR（光学字符识别）模型处理文档。如果需要，该模型可以从图像中提取文本。

文本分块

将提取的文本分解为更小、更易管理的部分。这种分块处理有助于提高后续处理和分析的效率。

嵌入模型

将每个文本块通过嵌入模型转换为向量。这些向量是捕捉文本语义含义的数字表示。

向量存储

将生成的向量存储在一个向量数据库中。这个数据库使系统能够根据语义相似性高效地检索相关信息。

用户输入问题

用户通过系统输入问题。这个问题将用于从向量数据库中检索最相关的信息。

问题嵌入

将用户输入的问题使用相同的嵌入模型进行处理，确保问题和文本块都在同一个向量空间中。

向量匹配

系统根据相似性将嵌入的问题与数据库中的向量进行匹配，并检索出最相似的文本块。

信息处理

系统根据相似度得分检索最相关的文档。然后，LLM（大语言模型）处理这些相关信息，生成对用户问题的详细回答。

最终答案

最终答案呈现给用户。这些答案是从检索到的文档中最相关的信息生成的，确保了准确性和相关性。

优势与挑战

优势

提高准确性：通过结合外部知识库的信息，RAG能够提供更准确和相关的答案。
增强可解释性：由于生成答案时参考了具体的上下文信息，因此答案的可解释性也得到了提升。
解决知识局限性：RAG弥补了大语言模型在专业领域知识理解和最新知识掌握方面的不足。

挑战

计算资源需求高：大规模的知识库检索和信息整合需要大量的计算资源。
实时性问题：对于需要快速响应的应用场景，RAG可能面临延迟的问题。

总之，RAG技术通过结合检索和生成两大关键技术，为自然语言处理领域带来了革命性的进步，并在多个应用场景中展现了卓越的潜力。随着技术的不断发展，RAG有望在未来发挥更大的作用。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-10

最新力作：一招提升RAG检索精度20%

2025-12-10

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

2025-12-09

客服、代码、法律场景适配：Milvus Ngram Index如何百倍优化LIKE查询| Milvus Week

2025-12-09

一键把碎片变成有料笔记：NoteGen，一款跨平台的 Markdown 笔记应用

2025-12-07

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-06

Palantir Ontology 助力AIP Agent落地工具介绍：Object Query

2025-12-05

把AI记忆做好，是一个价值6千亿美元的市场

2025-12-05

我错了，RAG还没完！AI记忆的结合会成为下一个技术风口

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

2025-10-11

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

总结了 13 个顶级 RAG 技术

2025-10-12

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

RAGFlow 深度介绍

2025-10-31

RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025-11-13

任何格式RAG数据实现秒级转换！彻底解决RAG系统中最令人头疼的数据准备环节

2025-10-12

你的 RAG 还在“垃圾进，垃圾出”？我用这套流程，把“废料”文档变成了黄金知识库

2025-09-16

大家都在问

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

2025-12-10

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部