我要投稿

再谈大模型检索增强生成——RAG

发布日期：2024-11-25 21:11:53 浏览次数： 1957 作者：AI探索时代

RAG检索增强生成——也是很多人理解的本地知识库，但RAG和本地知识库还是有很大区别的；但这不是今天讨论的重点，重点是为什么会有RAG技术，以及RAG技术解决了哪些问题？

大模型存在的几个主要问题，知识的局限性实时性和幻觉问题以及隐私数据

RAG并不能完全解决幻觉问题，但可以减少幻觉的发生

in context learning 语境学习/上下文学习

RAG与大模型

想知道为什么会有RAG技术，首先要知道大模型的几个缺陷。

大模型主要有以下几个问题：

知识的局限性

知识的实时性

大模型的幻觉

目前的大模型都是基于预训练模式，也就是说设计出来的模型需要经过大量数据训练之后才能够使用；但预训练有一个很严重的缺点就是，训练的数据都是之前，大模型无法获取训练数据之后的信息。

比如说，昨天训练了一个新的模型，那这个模型就不可能知道今天发生了哪些事情；所以模型的知识是截止到其训练数据收集的那一天。而这就是大模型知识的实时性问题。

其次是知识的局限性，大模型预训练的数据基本上来自于互联网中；但互联网中只有很小一部分数据是公开的，大部分数据都是不公开的；因此，训练模型就很难获取到这些不公开的数据，因此大模型的知识是有局限的。

这也是为什么，在问到大模型一些比较专业的问题时，大模型只能泛泛而谈，而无法给出一个详细的答案；原因就是因为它自己也不知道。

最后就是大模型的幻觉问题，幻觉问题其实也可以理解为一种特殊的知识局限性；那就是大模型在遇到一些不懂的问题时，它会根据自己的经验，然后一本正经的胡说八道。

这就是大模型的幻觉问题，产生幻觉问题的原因有很多，知识不足只是其中的一个原因而且也不是本质上的原因。众所周知，大模型的本质是一种数学模型，其是用概率和高维向量之间的运算来得到具体的结果。

但不论是概率还是向量之间的运算，都无法保证绝对的正确性，因此这就导致大模型会出现一本正经的胡说八道的现象，也就是幻觉的问题。

还有一个问题就是，数据的隐私性问题，比如说公司内部的经营数据，财务数据和科研数据等；这都属于公司的绝密信息，因此一般不能直接用来进行大模型的训练；但有时候又需要大模型使用这些隐私数据。

所以，为了解决以上问题业内就提出了一种补偿措施，那就是RAG技术。RAG技术主要包括两个方面，检索与生成；所谓的检索就是在向大模型提问之前，先从外部资料中检索到相关的资料，然后一起带给大模型；大模型就可以根据这些资料进行更加精准的回答。

而大模型使用RAG技术的原理就是In Context Learning(语义学习/上下文学习)技术；本质上来说就是一种提示词技术，通过RAG技术从外部资料中检索到数据之后，把这些数据当做上下文拼接到提示词中，然后大模型就可以理解这些提示词，然后做出正确的回答。

不过RAG技术虽然能够解决大模型以上的几个问题，但并不是完全解决；主要依赖于以下几个方面：

embedding模型

外部资料的质量问题

检索的准确性问题

大模型的质量问题

后面两个应该很好理解，主要就是embedding模型，所谓的embedding模型就是，RAG的检索并不是传统的数据库方式的字符匹配，而是基于向量模型的语义匹配的方式。

因此，就需要一种方式把资料从文本/视频/语音等多种格式的数据转化为向量模式，而这个就是embedding模型的作用；而embedding模型本质上也是一个大模型。

还有就是，大模型并没有解决幻觉问题，只是减少了幻觉的发生；以目前的技术来看，大模型幻觉问题还无法彻底解决，只能尽量地减少。

所以，一个好的RAG系统，不但需要一个好的大模型和embedding模型，更重要的是要有一个强大的检索系统；能够更加高效和准确地检索到准确的数据。

否则，就像你拿着一个错误的复习资料，即使你成绩再好，你又能考多少分。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

深度学习！构建基于LangGraph的RAG多智能体研究工具。

2025-04-26

用RAG与Agent提升企业问答效率：我的AI实践之路

2025-04-26

理解 RAG 第一部分：为什么需要它

2025-04-26

理解 RAG 第三部分：融合检索与重新排序

2025-04-26

理解 RAG 第四部分：检索增强生成评估框架

2025-04-26

理解 RAG 第五部分：管理上下文长度

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

【Ragflow】21.RagflowPlus(v0.2.1)：6个bug修复/增加重置密码功能

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB