我要投稿

优化RAG系统的四种工程化手段

发布日期：2024-10-22 12:54:54 浏览次数： 2096 作者：沙丘社区

检索增强生成（RAG）是一种人工智能框架，旨在利用大语言模型（LLM）进行跨外部知识源的自然语言查询。RAG的核心思想是通过外挂知识库的方式给大模型提供更可靠的知识来抑制模型产生幻觉，通过定期迭代知识库的方式就能解决大模型知识更新慢和训练成本高的问题。

在实践RAG的过程中，企业会发现RAG走通很容易，但实际落地生产的难度非常大。

RAG链路可拆分为三个部分：数据准备、知识检索和答案生成。为了使RAG能够应用于更加复杂、更具价值的场景，企业需要创建一个完整的RAG系统架构链路，以便能够通过工程化的技术手段对链路上的不同部分进行实验和优化。

优化手段1：数据准备环节，选择适合场景的分块和嵌入策略

根据应用场景复杂度的不同，应选择不同的分块策略。分块策略是指将数据分割成更小的部分，以便模型能够更加有效地处理。数据处理流程中应提前内置多种分块策略，以便在需要时进行切换。分块策略主要包括根据文档的自然部分（如章节、段落）进行分割、按固定长度进行切割、根据文本的语义相关性进行分割等。

分块策略需要与embedding模型相对应，确保能够正确捕捉每个分块的表征。

分块和嵌入策略的选择很大程度上取决于应用场景。企业在实践中可以尝试不同的分块和嵌入策略组合，从而找到适合应用场景的最佳方法。

优化手段2：知识检索环节，实施混合检索策略

基于向量的检索旨在从用户查询中提取与语义相关的上下文。但与基于关键词的检索相比，基于向量的检索需要更多的计算资源，与基于图的检索相比，基于向量的检索很难识别错综复杂的关系，也缺乏可解释性。

混合检索策略可以大大提高检索质量。混合检索策略结合了不同的检索算法，如基于向量、关键词、语义或结构化算法，通过使用多种检索算法，混合检索策略可以更全面地理解查询的意图和上下文，从而提高检索到信息的相关性和准确性。

混合检索还可以将不同类型的数据合并到一个查询中，从而大大提高检索效率并降低计算成本。从问题到查询再到答案的完整响应流程可以清楚地看到每个阶段的输出和决策过程，使得系统调试变得更加容易。每个阶段的输出结果还可用于提供和存储检索源信息，并在最终答案中呈现，提高答案的可信度。

优化手段3：答案生成环节，利用摘要和提示工程技术

为了使大模型更好的输出答案，企业可以从以下方面进行优化：

第一，在将来自检索引擎的数据块输入给大语言模型之前，应将其压缩成更易于管理和相关的格式。通过上下文过滤，删除检索结果中的无关信息；

第二，对检索到的知识进行摘要，减少需要处理的token数量，有助于模型专注于最相关的信息，并且如果使用的是专有模型，还可以降低总成本；

第三，通过提示工程引导大语言模型，确保模型在生成答案时，既利用了检索到的信息，也利用了模型内部的知识。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-18

微软PIKE-RAG全面解析：解锁工业级应用领域知识理解与推理

2025-04-18

AI 记忆不等于 RAG：对话式 AI 为何需要超越检索增强

2025-04-18

Firecrawl：颠覆传统爬虫的AI黑科技，如何为LLM时代赋能

2025-04-18

什么是RAG与为什么要RAG？

2025-04-18

Anthropic工程师揭秘高效AI Agent的三大秘诀

2025-04-17

Fireworks AI 分析

2025-04-17

文本向量的长度偏差及其在搜索中的影响

2025-04-17

效率提升30%，Token减少 98%！LightPROF加速GraphRAG落地

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

RAG系统中的“幕后英雄”：重排器如何提升信息检索的精准度？

2025-04-14

Dify 基础篇| 深度解读 RAG：为什么需要混合检索？

2025-04-13

OlmOCR如何成为搭建RAG 知识库的"智能中枢"？

2025-04-11

构建Agentic RAG 系统的方法有哪些？

2025-04-09

【AI知识点】什么是Agentic RAG？

2025-04-07

从“人工智障”到“真智能”：AI智能体如何突破最后一道技术壁垒？

2025-04-05

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB