我要投稿

从RAG到RAG+：让大模型更懂业务的权威指南

发布日期：2025-01-09 19:10:18 浏览次数： 1991 作者：芝士AI吃鱼

每当我向非技术背景的朋友解释大语言模型时，我常常用"博学但缺乏实践经验的应届生"作比喻。这些模型确实掌握了海量的知识，但在特定领域的实际应用中，常常会暴露出"经验不足"的问题。就像一位刚毕业的法学生，虽然能流畅地背诵法条，但面对真实的案件时可能会觉得无从下手。

微软亚洲研究院的研究团队近期发布的这篇综述，正是致力于解决这个"经验不足"的问题。这篇论文不仅系统地梳理了检索增强生成(RAG)技术的发展脉络，更重要的是提供了一个全新的视角，帮助我们理解和解决大模型在实际应用中遇到的各种挑战。

为什么简单的RAG还不够用？

让我们先看一个真实的场景。某金融机构尝试用ChatGPT来回答客户的投资咨询问题。为了确保答案的准确性，他们实施了一个基础的RAG方案：把投资产品说明书、市场分析报告等文档接入模型。但实际效果却不尽如人意。

当客户问"这个基金适合我吗？"时，模型往往会直接从产品说明书中摘录风险收益特征。但一个专业的投资顾问会怎么做？

他会先了解客户的投资目标、风险承受能力、投资期限等信息，然后结合市场环境和产品特点给出建议。这种专业的咨询过程涉及到复杂的推理和判断，远非简单的文档检索所能支持。

理解四个层次的知识需求

论文首次系统地定义了RAG应用中的四个层次需求。这个分层框架源于对大量实际应用案例的观察和总结，让我们通过具体例子来理解每个层次：

**第一层是显式事实查询。**比如"公司的退休金政策是什么？"这类问题只需要从员工手册中找到相关段落即可。这是最基础的RAG应用场景。

**第二层是隐式事实查询，需要综合多个信息源。**例如"我现在的工资和工龄，五年后能拿到多少退休金？"这就需要检索并关联多个政策条款，还要进行简单的计算。

**第三层是可解释推理查询，要求理解和运用专业的决策流程。**以医疗诊断为例，医生会遵循"望闻问切"的次序，逐步收集信息，形成诊断。模型需要理解并模仿这种专业的思维过程。

**第四层是隐性推理查询，这可能是最接近人类专家直觉的层次。**比如经验丰富的医生看到某些症状组合，就能联想到可能的罕见病因，这种判断往往基于大量病例经验，而非明确的诊断规则。

走向更智能的RAG解决方案

理解了不同层次的需求，我们就能更有针对性地设计解决方案。

对于第一层的显式事实查询，传统的RAG方案其实已经够用，但在工程实现上还有优化空间。比如文档切分的策略就很关键。如果切分得太细，可能会丢失上下文信息；切分得太粗，又会引入无关信息。一个实用的做法是根据文档的逻辑结构来切分，比如保持完整的段落或章节，而不是机械地按字数切分。

对于第二层的隐式事实查询，核心挑战是如何让模型"主动"获取必要信息。迭代式RAG是一个有效的解决方案：模型先基于初始问题检索一部分信息，发现信息不足时，自动形成新的检索请求，直到收集足够的信息才给出最终答案。

在处理第三层的可解释推理查询时，"提示调优"显示出独特优势。以医疗问诊为例，我们可以设计这样的提示模板：

1. 请先详细了解患者的主诉和症状；
2. 根据症状有针对性地询问病史；
3. 建议必要的检查；
4. 结合所有信息作出初步诊断；
5. 制定治疗方案。

这种结构化的提示能有效引导模型遵循专业的诊疗规范。

第四层的隐性推理查询最具挑战性，因为我们要让模型学习专家的"直觉"。一个可行的方案是构建特定领域的案例库，并通过精心设计的标注来捕捉专家的判断依据。

比如在医疗领域，除了记录最终诊断，还要让专家解释为什么会想到这个诊断，看到了哪些关键线索。这些解释可以帮助模型学习专家的思维模式。

总结

这篇综述不仅梳理了当前RAG技术的现状，也为未来发展指明了方向。一个明显的趋势是，RAG正在从单纯的知识检索，向知识的结构化表达和专业化推理演进。

未来的RAG系统可能会更像一个"数字学徒"，不断从与人类专家的互动中学习和改进。它不仅要会查资料，还要学会专家思考问题的方式。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-27

AI 写代码总是翻车？Upstash 创始人怒推 Context7：给 LLM 喂上最新鲜的官方文档。

2025-04-26

葵花宝典之「知识库」调优秘籍！RAG优化指南！

2025-04-26

RagFlow文档解析过程分析

2025-04-26

深度学习！构建基于LangGraph的RAG多智能体研究工具。

2025-04-26

用RAG与Agent提升企业问答效率：我的AI实践之路

2025-04-26

理解 RAG 第一部分：为什么需要它

2025-04-26

理解 RAG 第三部分：融合检索与重新排序

2025-04-26

理解 RAG 第四部分：检索增强生成评估框架

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB