我要投稿

从0开始学RAG第一篇——RAG快速入门

发布日期：2024-04-05 21:02:21 浏览次数： 6938

作者：AIGC小白入门记

微信搜一搜，关注“AIGC小白入门记”

从0开始学RAG第一篇——RAG快速入门

作者：lucas大叔
原文地址：https://zhuanlan.zhihu.com/p/685411934

一、什么是检索增强生成（RAG）？

检索增强生成（RAG）作为一种将LLM与外部数据源打通的方法，可以有效弥补LLM的实时性和幻觉等短板。

二、检索增强生成（RAG）流程包含哪些环节？

常规的RAG流程包括indexing、retrieval和generation三部分，但当面对真实使用场景时，还需要采用更先进的技术和方案来解决现实中的挑战。

下图汇总了RAG全链路上各个环节可应用的技术，可以看到林林总总的还不少，接下来我们会用一个系列对图中的每项技术进行讲解和代码实践。有条件的同学可以follow 视频教程。

RAG全链路视频 https://www.youtube.com/watch?v=wd7TZ4w1mSw&feature=youtu.be

2.1 Indexing

构建RAG应用首先要通过相应的loader加载数据，不论是pdf、word、markdown，亦或是网页。加载完成后再选择TextSplitter将文档切割为chunk用于embedding和向量存储。

2.2 Retrieval

最简单的retrieval是将向量存储作为检索器，检索获取相似文档。此外，还有各种类型的retriever，后面我们会一一介绍。

2.3 Retrieval

将retriever检索到的候选文档和query与prompt一并扔给LLM，让它根据prompt中的指令生成答案，生成的答案再用parser解析成人类方便阅读的格式。

三、检索增强生成（RAG）代码解读？

本节首先讲解如何利用ChatGPT快速构建RAG应用，大家可以根据自己的使用需求将代码中embedding模型和LLM替换成开源大模型。

以下是RAG应用的快速实现示例，初学者可以运行体验一下。

导包











    import bs4    from langchain import hub    from langchain.text_splitter import RecursiveCharacterTextSplitter    from langchain_community.document_loaders import WebBaseLoader    from langchain_community.vectorstores import Chroma    from langchain_core.output_parsers import StrOutputParser    from langchain_core.runnables import RunnablePassthrough    from langchain_openai import ChatOpenAI, OpenAIEmbeddings

3.1 INDEXING

Load Documents













    # Load Documents    loader = WebBaseLoader(        web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),        bs_kwargs=dict(            parse_only=bs4.SoupStrainer(                class_=("post-content", "post-title", "post-header")            )        ),    )    docs = loader.load()

Split





    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)    splits = text_splitter.split_documents(docs)

Embed








    # Embed    vectorstore = Chroma.from_documents(        documents=splits, embedding=OpenAIEmbeddings()    )    retriever = vectorstore.as_retriever()

3.2 RETRIEVAL and GENERATION

Prompt





    # Prompt    prompt = hub.pull("rlm/rag-prompt")





    # LLM    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)





    # LLM    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

Post-processing






# Post-processingdef format_docs(docs):    return "\n\n".join(doc.page_content for doc in docs)

Chain










# Chainrag_chain = (    {"context": retriever | format_docs, "question": RunnablePassthrough()}    | prompt    | llm    | StrOutputParser())

Question





# Questionrag_chain.invoke("What is Task Decomposition?")

通过上面的示例代码，可以快速构建一个简单的RAG demo，体验LLM的乐趣。若想打造能够工程落地的RAG应用，需要针对具体数据和bad case确定总的解决方案，在indexing、retriever和generation等环节上进行联合优化。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

实测Qwen3-Coder，这就是目前最强的开源编程模型

2025-07-23

DeepSeek V3.1 Base / Instruct 发布

2025-08-20

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

Qwen3-Coder开源：面向世界的智能编程引擎

2025-07-23

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

有点东西！Qwen开源会写中文的生图模型Qwen-Image

2025-08-05

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

DeepSeek-V3.1-Base来了！MoE架构+128K上下文，性能再进化

2025-08-20

大家都在问

大模型会替代搜索引擎么?

2025-10-16

OpenAI“隐秘客户榜”曝光：谁在烧掉上万亿Token？

2025-10-16

Comet、Dia相继开放！AI浏览器到底在解决我们的什么问题？

2025-10-14

为何底层数据湖决定了 AI Agent 的上限？

2025-10-13

埃森哲的大裁员，向市场发出了什么信号？

2025-10-13

分发变现闭环: sora2不是“又一次热点”，而是质变？

2025-10-09

OpenAI搭台：AI应用繁荣周期的起点？

2025-10-09

OpenAI 开发者大会DevDay 2025发布了什么？

2025-10-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB