我要投稿

探索RAG与Multi-Agent的结合：解决复杂任务的新方法

发布日期：2024-08-26 16:42:22 浏览次数： 3001

作者：七哥的AI日常

微信搜一搜，关注“七哥的AI日常”

最近帮企业定制了一个langgraph+rag的项目，跟大家简单介绍一下设计架构和具体的应用。如果大家有兴趣，我也可以出一期视频，给大家详细介绍一下。我们会一步步探讨如何构建一个可以控的Agent，以执行RAG任务，并最终展示一个简短的演示。

什么是RAG？

RAG，全称Retrieval-Augmented Generation，是一种辅助AI语言模型生成基于外部信息文本的方法。在RAG中，我们将数据拆分成多个小块，然后将这些小块嵌入到低维空间并存储在向量存储中。当用户提出查询时，该查询也会嵌入到相同的低维空间，与向量存储中的信息进行比较，从而检索到相关的信息作为上下文，并与查询一起输入到语言模型中，生成基于上下文的最终答案。

什么是Agent？

智能代理是先进的AI系统，设计用于执行需要连续推理的复杂任务。它们可以预见未来的步骤，记住过去的对话，并使用不同的工具根据情况和需求调整其响应。

为什么我们需要控制Agent？

控制智能代理的原因在于代理自主性与过程控制之间的权衡。代理的自主性越高，我们对其控制就越少。使用常规代理时，我们无法控制它何时使用工具或以何种顺序使用工具，也无法控制其得出的结论，特别是在处理其内在机制中的幻觉或预训练知识时。然而，通过构建工作流程，我们可以定义解决问题的具体路径，从而对每一步进行全面控制，但这需要量身定制的解决方案，可能耗时且复杂。

构建可控的RAG代理的基本模块

语义相似性

在我们的嵌入空间中，嵌入数据的方式使得相似的词汇彼此接近。例如，“国王”和“王后”的距离会比“狗”近。利用这种语义相似性，我们可以在简单的RAG任务中，例如历史事件查询中，检索到相关的上下文并生成答案。

处理复杂问题

对于更复杂的问题，我们需要不同的方法来构建数据。例如，我们可以使用语言模型生成章节摘要，包含关键点和章节总结，增加找到解决此类问题的可能性。

多向量存储

为了精确处理复杂问题，我们可以建立多个向量存储，例如文本块存储、章节摘要存储和书籍引用存储。

构建可控RAG代理的工作流程

我们需要以下能力：

工具：代理需要具备检索和回答问题的工具。
推理能力：构建解决问题的流程。
过程控制：确保每一步按预期进行。
终止判断：知道何时停止代理的操作。
评估任务表现：评估任务完成的效果。

Agent Tools

我们需要三种检索工具：引用检索、章节摘要检索和文本块检索。此外，还需要一种回答工具，用于在中间步骤或最终生成答案时使用已有的上下文。

问题匿名化

为了避免预训练模型的偏见，我们可以将问题中的特定实体替换为变量，例如将“关羽是如何打败华雄的？”替换为“X是如何打败Y的？”，构建一般计划后再替换回原始名称。

代理工作流程

输入问题并匿名化。
使用计划器构建匿名问题的解决步骤。
去匿名化并分解为检索或回答工具。
任务处理器选择合适的工具进行操作。
根据上下文和计划进行重新规划，直到问题解决或达到终止条件。

终止条件

我们可以通过以下方法判断何时停止：

每一步询问语言模型当前上下文是否足够回答问题。
直到新信息量低于某个阈值。
限制图的递归次数，如达到100次遍历后停止。

评估

我们可以通过以下指标评估RAG任务的效果：

答案正确性：答案是否事实正确。
忠实度：生成的答案是否基于检索的信息。
答案相关性：答案与问题的相关性。
语义相似度：生成答案与标准答案的语义相似度。

总结

通过结合RAG和智能代理，我们能够解决复杂的任务，尽管可能需要权衡时间和成本，但在解决无法通过其他方法解决的任务时，这种方法具有显著优势。

如果您有任何问题或需要进一步的讨论，请随时联系我。谢谢！

常见问题

为什么不同时检索所有信息？

这是设计上的选择，同时检索所有信息可能会导致时间和成本的增加，且不一定需要所有的信息。例如，针对某些特定问题，代理可能只需要引用检索工具。

如何验证答案是否是幻觉？

我们可以使用语言模型作为判断工具，验证生成的答案是否基于原始上下文。

这种方法是否具有成本效益？

这取决于具体的使用场景。如果现有解决方案无法解决问题，而通过客户支持等方式需要花费数天时间，那么这种方法可以在几秒钟或几分钟内解决，从而节省时间和成本。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-04-02

RAG进化了，深扒Claude Code源码中RAG高级技巧

2026-04-01

Claude Code 源码一夜流出：会看热闹的人很多，会读源码的人很少

2026-03-31

OpenDataLoader：PDF文档提取的一站式方案

2026-03-30

只用文件系统和 Bash，Vercel 做出了一套高效 RAG

2026-03-25

GraphRAG新范式 = LPG + 本体RDF

2026-03-25

基于 Ray 的蚂蚁数据构建引擎在搜推和 RAG 场景的实践

2026-03-23

知识基座：让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

2026-03-21

面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

2026 年你需要了解的 RAG 全解析

2026-01-15

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

2026-02-13

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

当 Claude Code 连接 NotebookLM，个人 AI 终于有了“长期记忆”

2026-01-06

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

RAG 落地全干货深度分享：从“效果不理想”到生产级 RAG 系统的进化之路

2026-02-06

OpenViking：面向 Agent 的上下文数据库

2026-02-02

今天，分享Clawdbot记忆系统最佳工程实践

2026-01-28

从 RAG 到 Agentic Search，一次关于信任 AI 判断的认知升级

2026-02-05

告别“伪智能”代码：用 Spec + RAG 打造真正懂你的AI程序员

2026-02-06

大家都在问

企业AI落地三重门，用友如何破局？

2026-03-17

Embedding相似度虚高，如何用langchain+Milvus搭建CRAG解决？

2026-03-11

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部