微信扫码
添加专属顾问
我要投稿
深入揭秘RAG、LangChain、Agent的密切联系,解锁AI开发新技能。 核心内容: 1. RAG技术如何提升大语言模型能力 2. LangChain框架整合RAG技术创建Agent的方法 3. AI-Agent开发实战应用案例
然后用一句话来概括这张图:
你可以在LangChain框架中使用RAG技术来创建一个Agent,扮演特定的角色专门解决用户的特定需求。
接下来我们按顺序介绍这三个名词。
RAG(Retrieval-Augmented Generation)的中文名是检索增强生成,是一种使大语言模型在生成回答时能够读取外部信息的技术,该技术可以简单理解为在生成内容前,先从外部数据库中检索出相关信息作为参考。
打一个比方,你读完全日制高中的课程,咱可以说你已经完成了预训练(Pre-training),已经具备了一个通用大模型的基础能力。然后你填报了计算机科学专业,完成四年的专业课学习,咱可以说你已经完成了一轮微调(Fine-Tuning),然后你就是一个合格的可以解决各类基础计算机相关下游任务(Downstream tasks)的大模型了.
但毕竟本科四年学习周期有点长,咱想一个速成点的办法就是以你高中掌握的知识,再加上身边放一堆计算机专业的书籍,那这样你有了开卷考的buff+加持,也勉强可以成为一个低配版解答基础计算机相关的问题的大模型了。而你收到问题,基于你高中的知识,在专业书籍中找到答案,组织后反馈给提问者的过程就是检索增强生成(RAG)。
由于训练和微调的成本依然高企+超长上下文仍处于理论阶段,所以目前RAG这样的外挂技术在新闻、科技、医疗等领域以及一定规模团队的企业内部智库这些知识更新频繁的场景有着肉眼可见的应用前景。
有了RAG技术,新的问题来了。如何将检索、生成、数据存储、API调用等功能整合到一个整体的应用系统中呢?这时,LangChain便派上了用场。
Langchain是一个用于开发LLM应用的开源框架,旨在帮助开发者更轻松地构建由大语言模型驱动的应用程序。RAG作为大语言模型非常重要的应用领域,LangChain自然也有比较充分的支持而且LangChain还能帮助开发者灵活地设计多步骤工作流,让RAG的结果更可控。
举个简单的应用例子,假如我们想构建一个法律咨询应用,它需要完成以下几个步骤
1.接收用户的具体案例;
2.从向量数据库中检索相关法律条款;
3.返回并用大语言模型生成回答;
4.在生成答案前对用户答案的合规性做出提醒。
这个具体的RAG应用实例,通过LangChain可以快速实现。LangChain提供的模块化组件和接口,便于开发者根据具体需求自由组合。对于非资深开发者来说,LangChain的框架大大简化了开发难度,让大家能够轻松实现“搭积木”式的开发。
了解了RAG和LangChain之后,我们再来看看AlAgent的概念。
Agent 是一种可以自主感知环境、做出决策并执行行动的智能体系统。正如它的英文名,Agent相当于一个任务代理人,可以“理解”用户设定的流程、规则后按自己的想法来处理一系列任务
如图所示,Agent通常基于大语言模型(LLM),创建者用提示词模板(Prompt Template)来指定它的角色和工作内容;Agent拥有“记性”(Memory),这让它不但可以记得会话的上下文,也可以记得用户的偏好和个性化要求,更好地满足用户的需求;Agent拥有“行为自主性”(Action)它在接收指令后,可以通过大语言模型来判断是否需要使用相应的工具来自主完成任务。
由于Agent具备了这些特点,所以比较适用于自动化任务、数字助理、游戏角色等应用。
让我们回到开头的那张图里,这三个名词各自的职责和执行流程如下
LangChain可以为任务提供足够复杂的工作流结构,而Agent则负责根据PromptTemplate的设定执行这些流程中的每一个任务环节。
LangChain框架也提供了各种相应的库对RAG技术进行支持,让RAG技术可以作为Agent从Knowledge Base获取知识的工具。
Agent获得相应的知识后,再由LLM组织并理解,作出返回给客户有用的信息或是执行特定操作的判断,并由Agent来完成。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-12
还在靠 RAG 查文档?教你一招,AI 回答更靠谱!
2025-04-12
基于文本结构分块 - 文本分块(Text Splitting),RAG不可缺失的重要环节
2025-04-12
ReSearch 框架:让 AI 像人类一样边思考边搜索
2025-04-11
OlmOCR如何成为搭建RAG 知识库的"智能中枢"?
2025-04-10
RAG技术演进的四大核心命题
2025-04-10
另类RAG技术论文三篇分享、备忘
2025-04-10
旺精通~智能体检索增强生成(Agentic RAG)综述:背景、模型、框架、测试、展望
2025-04-10
RAG 的检索优化:MMR 平衡相关性与多样性
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07