我要投稿

使用langchain实现RAG（检索增强生成）

发布日期：2024-04-21 12:42:27 浏览次数： 4410

作者：AI寰宇

微信搜一搜，关注“AI寰宇”

检索增强生成（Retrieval-Augmented Generation, RAG），它通过结合检索和生成两种机制，提升了模型在复杂任务上的表现力和准确性。

大语言模型的局限性：

数据依赖性：

大语言模型的性能在很大程度上依赖于其训练数据的质量和多样性。如果训练数据存在偏差或不全面，模型可能会学习到错误的模式，并在实际应用中表现出偏差。

幻觉问题（Hallucination）：

大型语言模型在生成文本时产生了一个问题，即模型生成的内容虽然语法正确、流畅自然，但却包含不准确或完全虚构的信息。这种现象被称为“幻觉”，因为模型生成的文本给人一种它“知道”或“理解”了某些事情的感觉，而实际上这些内容可能并不基于真实世界的知识或事实。又分为事实性幻觉：即模型生成的内容与可验证的现实世界事实不一致，和忠实性幻觉：模型生成的内容与用户的指令或上下文不一致。

可解释性：

大型模型的决策过程往往是黑盒的，很难解释它们为什么会生成特定的输出。这对于需要高度可解释性的应用场景（如医疗、法律）构成了挑战。

常识和世界知识：

模型可能缺乏对世界的基本常识或特定领域知识的深入理解，这导致它们在需要这些知识的复杂任务上表现不佳。

RAG的出现：

为了解决大型模型的局限性，研究者们开始探索如何将外部知识源整合到语言模型中。这种方法允许模型在生成响应时检索和利用最新的、相关的信息，从而提高其准确性和可靠性。RAG模型通过结合检索系统来增强语言模型的能力。检索系统能够快速从大量文档中找到与输入查询最相关的信息，这些信息随后被用作生成模型的上下文。

RAG模型的核心思想是利用检索系统从大量文档中找到与输入查询相关的文档片段，然后将这些片段作为生成模型的上下文，以生成更准确和信息丰富的响应。

RAG模型的处理流程：

Text Load（文本加载）：

在这一步，模型从数据源加载文本数据。这可能涉及到从文件、数据库或其他存储系统读取文本内容。

Text Split（文本分割）：

加载文本后，模型需要将长文本分割成更小的单元，如句子或段落。这有助于模型更有效地处理文本，并为检索阶段做好准备。

Generate and save Embedding（生成并保存嵌入向量）：

在这一步，模型为文本或其分割后的单元生成嵌入向量（embeddings）。这些向量是文本的数值表示，能够捕捉文本的语义信息，并用于后续的检索和生成步骤。

User Query（用户提问）：

过程开始于用户的一个问题或请求。用户通过界面提交他们想要模型解答的问题。

Data Retrieval（数据检索）：

模型接收到用户的问题后，执行检索步骤，从预先构建的知识库或数据集中召回与问题相关的文档或信息片段。这通常涉及到计算问题与数据集中各个文档的相关性得分，并选择得分最高的若干文档。

Prompt Injection（注入Prompt）：

检索到的相关文档片段随后被注入到一个提示（Prompt）中。这个提示是一个结构化的文本模板，它将用户的问题和检索到的文档片段结合起来，形成一个新的输入文本。提示的设计对模型的性能有重要影响，因为它需要清晰地引导模型如何结合检索到的信息和原始问题。

LLM Answer Generation（LLM生成答案）：

注入了提示的输入文本被送入大型语言模型（Large Language Model，LLM）进行处理。LLM根据提示中的信息生成答案。这个阶段利用了模型的语言理解和文本生成能力，以产生一个连贯、准确且信息丰富的回答。

实战操作：

由于大模型无法获取实时的天气信息，所以我们以西安的天气信息为例，使用langshain来实现一个简单的RAG：

准备一个名为tianqi.txt的文件，内容是西安4月的天气状况

Text Load：

使用document_loaders的TextLoader方法实现，参数是文件路径：

from langchain.document_loaders import TextLoader
loader = TextLoader('tianqi.txt')documents = loader.load()

Text Split：

使用CharacterTextSplitter方法实现，separator是以该字符切割，chunk_size是每个块的大小，chunk_overlap是块之间最大的重叠量：

from langchain.text_splitter import CharacterTextSplitter
text_splitter = CharacterTextSplitter(separator="\n",chunk_size=50, chunk_overlap=10)chunks = text_splitter.split_documents(documents)

Generate and save Embedding

使用from_documents方法存储，参数是：1、要存的内容，类型的列表；2、embedding方法；3、persist_directory是存储的路径：

from langchain_community.vectorstores.chroma import Chromafrom langchain_community.embeddings.huggingface import HuggingFaceEmbeddings
db = Chroma.from_documents(chunks,HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2"),persist_directory="E:\model\embedding")

User Query

用户提问一些模型不知道的问题，比如西安4月中旬的天气状况

Data Retrieval

使用as_retriever方法查询，

retriever = db.as_retriever()docs = retriever.get_relevant_documents("几号下雨")p_info = ""for doc in docs:p_info = p_info + doc.page_content

Prompt Injection

创建一个prompt模板，将查询到的结果与prompt模板结合，使用PromptTemplate方法：

from langchain.prompts import PromptTemplate
prompt_template = """你是一个问答机器人。你的人物是根据下述给定的信息回答用户问题。确保你的回复完全依赖下述已知的信息，不要编造答案。如果下述已知信息不足以回答用户的问题，请直接回复“我无法回答您的问题”。
已知信息：{info}
用户问题：{question}
"""
template = PromptTemplate.from_template(prompt_template)prompt = template.format(info=p_info,question="4月中旬西安几号下雨")

LLM Answer Generation

我们使用Kimi的api，这里使用第三方的llm需要自定义，只需要实现_call方法即可：

from typing import Anyimport loggingfrom langchain_core.language_models import LLMfrom openai import OpenAI

temperautre = 0.3class Kimi(LLM):
def _llm_type(self) -> str:"""Return type of LLM."""return "kimillm"
def _call(self,prompt: str,**kwargs: Any,) -> str:try:client = OpenAI(api_key="sk-85km8HupH4TTSvxseqDvVPz5Lsu4kdiXAJaX7ypQgAFLevT4",base_url="https://api.moonshot.cn/v1",)completion = client.chat.completions.create(model="moonshot-v1-8k",messages=[{"role": "system", "content": "你是 Kimi，由 Moonshot AI 提供的人工智能助手。"},{"role": "user", "content": prompt}],temperature=temperautre,)return completion.choices[0].message.contentexcept Exception as e:logging.error(f"Error in kimi: {e}",exc_info=True)raise

然后将prompt传入：

output = llm.invoke([HumanMessage(content=prompt)])print(output)

结果：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-26

ASR+LLM+RAG视频内容识别全方案

2025-12-26

从工单、文档到结构化知识库：一套可复用的 Agent 知识采集方案

2025-12-26

RAG知识库-文档过滤和检索

2025-12-25

RAG落地实践：知识库三层架构和关键组件

2025-12-25

Dify x 阿里云 Tablestore：向量检索与结构化数据统一存储方案

2025-12-25

RAG检索增强是在给大模型“喂”数据？不，你是在为它构建一整套物流体系

2025-12-24

ChatGPT VS Claude ，Agent记忆用对话压缩还是RAG按需检索

2025-12-24

上下文不等于记忆：从单Agent到多Agent协作，记忆系统是关键

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

2025-10-11

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

总结了 13 个顶级 RAG 技术

2025-10-12

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

RAGFlow 深度介绍

2025-10-31

RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025-11-13

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

任何格式RAG数据实现秒级转换！彻底解决RAG系统中最令人头疼的数据准备环节

2025-10-12

大家都在问

为什么Claude Code不用RAG？

2025-12-23

终于，NotebookLM 和 Gemini 合体了。这是什么神之更新？

2025-12-21

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

2025-12-10

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean