我要投稿

【一文读懂】RAG的重要组成-Embedding Model

发布日期：2024-09-04 11:30:24 浏览次数： 5886 作者：码农随心笔记

根据我的观察，在各个热门的RAG引擎（如AnythinRAG，RAGFlow，Dify）中，都包含了Embedding Model（嵌入模型），那嵌入模型这个强大的工具，在RAG引擎中究竟起到什么作用呢？本篇我将会通过通俗易懂的方式，为各位同学揭开它的神秘面纱。

什么是Embedding

在学习嵌入模型之前，首先要搞明白什么是Embedding ？Embedding 是将离散的非结构化数据转换为连续的向量表示的技术。在自然语言处理中，Embedding 常常用于将文本数据中的单词、句子或文档映射为固定长度的实数向量，使得文本数据能够在计算机中被更好地处理和理解。通过 Embedding，每个单词或句子都可以用一个实数向量来表示，这个向量中包含了该单词或句子的语义信息。

以文本处理为例，假设你有一句话：“猫喜欢鱼。”在计算机中，单词是以文字的形式存在的，但计算机并不能直接理解这些文字。Embedding 的作用就是把每个单词转化为一个向量，例如把“猫”转化为一个向量 [0.1, 0.2, 0.3]，把“鱼”转化为另一个向量 [0.4, 0.5, 0.6]。这样，计算机就能用这些向量来进行各种计算，比如找出“猫”和“鱼”之间的关系。

这些向量不仅仅是随机的数字，而是通过学习得到的，使得在某些特定的任务上，它们能够很好的表示数据之间的相似性和关系。例如，相似的词（如“猫”和“狗”）在向量空间中会比较接近，而不相似的词（如“猫”和“汽车”）则会比较远。

那为什么需要向量呢？计算机处理文字时，它们只能处理数字。因此，我们需要将文本转换为计算机可以理解的数字形式。这个向量就像是数据在数学空间中的一个“地址”，通过这个“地址”，计算机能够更容易地理解数据之间的关系。

什么是Embedding Model

在自然语言处理（NLP）中，Embedding model（嵌入模型）是一种将词语或句子转换成数字向量的技术。它实际上是将高维、离散的输入数据（例如文本、图像、声音等）转换成低维、连续的向量表示的过程。Embedding Model 就像是给每个词或句子分配一个独特的“指纹”，这个“指纹”能够在数学空间中表示这个词或句子的含义。这种模型将每个词语或句子转换成一个固定长度的数字向量。通过这种方式，计算机可以对文本进行数学计算，比如比较词语的相似性、分析句子的意义等。

Embedding Model的作用

在RAG（Retrieval-Augmented Generation）引擎中，Embedding model扮演着至关重要的角色，它用于将文本转换为向量表示，以便进行高效的信息检索和文本生成。以下是Embedding model 在RAG引擎中的具体作用和示例：

1. 文本向量化：

- 作用：将用户的问题和大规模文档库中的文本转换为向量表示。

- 举例：在RAG引擎中，用户输入一个问题，如“如何制作意大利面？”，Embedding model会将这个问题转换为一个高维向量。

2. 信息检索：

- 作用：使用用户的查询向量在文档库的向量表示中检索最相似的文档。

- 举例：RAG引擎会计算用户问题向量与文档库中每个文档向量的相似度，然后返回最相关的文档，这些文档可能包含制作意大利面的步骤。

3. 上下文融合：

- 作用：将检索到的文档与用户的问题结合，形成一个新的上下文，用于生成回答。

- 举例：检索到的关于意大利面的文档会被Embedding model转换为向量，并与问题向量一起作为上下文输入到生成模型中。

4. 生成回答：

- 作用：利用融合了检索文档的上下文，生成模型生成一个连贯、准确的回答。

- 举例：RAG引擎结合用户的问题和检索到的文档，生成一个详细的意大利面制作指南作为回答。

5. 优化检索质量：

- 作用：通过微调Embedding model，提高检索的相关性和准确性。

- 举例：如果RAG引擎在特定领域（如医学或法律）中使用，可以通过领域特定的数据对Embedding模型进行微调，以提高检索的质量。

6. 多语言支持：

- 作用：在多语言环境中，Embedding model可以处理和理解不同语言的文本。

- 举例：如果用户用中文提问，而文档库包含英语内容，Embedding model需要能够处理两种语言的文本，并将它们转换为统一的向量空间，以便进行有效的检索。

7. 处理长文本：

- 作用：将长文本分割成多个片段，并为每个片段生成Embedding，以便在RAG引擎中进行检索。

- 举例：对于长篇文章或报告，Embedding model可以将其分割成多个部分，每个部分都生成一个向量，这样可以在不损失太多语义信息的情况下提高检索效率。

通过以上几点，Embedding mode 在RAG引擎中提供了一个桥梁，连接了用户查询和大量文本数据，使得信息检索和文本生成成为可能。如下图所示，Embedding mode正处于整个RAG系统的中心位置。

RAG引擎中的工作流

以下是一个RAG引擎中工作流的示意图，此流程基本与各大RAG引擎相匹配，只是各个不同的RAG引擎，其内部算法可能有所区别而已。让我们一起来看看，RAG引擎是如何工作的。

上图中的1-5步，流程说明如下：

1. 将查询传递给嵌入模型，并在语义上将查询内容表示为嵌入的查询向量。

2. 将嵌入式查询向量传递给向量数据库。

3. 检索前 k 个相关上下文 – 通过查询嵌入和我们知识库中所有嵌入块之间的距离来衡量检索结果。

4. 将查询文本和检索到的上下文文本传递给对话大模型（LLM）。

5. LLM 将使用提供的内容生成回答内容。

总结

通过以上分析，估计各位同学对RAG引擎的工作流，以及Embedding model的作用已经有所了解，明白这些基础知识后，对以后继续学习大模型的Fine-tuning，LangChain，AI Agent等方法和概念提供了莫大帮助。

--THE END--

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

深度学习！构建基于LangGraph的RAG多智能体研究工具。

2025-04-26

用RAG与Agent提升企业问答效率：我的AI实践之路

2025-04-26

理解 RAG 第一部分：为什么需要它

2025-04-26

理解 RAG 第三部分：融合检索与重新排序

2025-04-26

理解 RAG 第四部分：检索增强生成评估框架

2025-04-26

理解 RAG 第五部分：管理上下文长度

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

【Ragflow】21.RagflowPlus(v0.2.1)：6个bug修复/增加重置密码功能

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB