微信扫码
与创始人交个朋友
我要投稿
RAG Agent核心是它的“大脑”,一个复杂的确定性图,它能让AI进行复杂的推理。而且,这个系统一般还能防止“幻觉”。确保所有答案都基于提供的数据,而不是凭空想象。
那我们要完成的这个系统需要具备哪些方面的能力呢?
大体的框架图如下:
它是怎么工作的呢?简单来说,就是先把PDF文档加载进来,然后进行文本预处理,生成每个章节的摘要,再把这些内容编码到向量库中。当有人问问题时,AI会先对问题脱敏,生成一个规划,然后再根据这个规划进行细化出执行任务,最后生成最终答案。详细步骤如下:
数据准备,召回的retriever,可以理解为给文档建立出索引,用户后续的召回。当然在S1的搭建高级RAG中,我们只需要分段的即可。
接下来,可以构建标准的adavanced RAG的流程,召回块 -> 保留与query相关的块 -> 根据是否相关来决定是否需要改写 -> 答案如果可用则结束了 (这里的很多函数都可以在langgraph的官方examples中找到)
对于更复杂的任务,仅通过基于语义相似性检索信息无法回答问题,需要更复杂的pipeline。为了实现这一目标,我们先忘记adavanced rag的流程。我们需要定义出Agent的工具,一般RAG的tool就是S1中的retriever(召回)。(为了更复杂一些,我们在S1数据准备中,准备了3个retriever(文档块、摘要、引用)单独作为不同的tool)
可以得到3个子图:
有了工具,那接下来就是Agent的核心,planning部分了。
首先需要制定计划->计划细化到工具上
制定计划
计划细化
示例:
question = {"question": "主人公是如何打败反派的?"}
my_plan = planner.invoke(question) # Generate a plan to answer the question
print(my_plan)
refined_plan = break_down_plan_chain.invoke(my_plan.steps) # Refine the plan
print(refined_plan)
#### output
steps1 = [
'识别故事中的主人公和反派。',
'找到主人公和反派之间的高潮或最终对决。',
'分析主人公在这次对决中采取的行动。',
'确定导致反派失败的具体行动或策略。',
'总结发现,回答主人公是如何打败反派的。'
]
steps2 = [
'通过从书籍块的向量存储、章节摘要或书籍引用中检索相关信息来识别故事中的主人公和反派。',
'通过从书籍块的向量存储、章节摘要或书籍引用中检索相关信息来定位主人公和反派之间的高潮或最终对决。',
'通过从书籍块的向量存储、章节摘要或书籍引用中检索相关信息来分析主人公在这次对决中采取的行动。',
'通过从书籍块的向量存储、章节摘要或书籍引用中检索相关信息来确定导致反派失败的具体行动或策略。',
'通过根据给定上下文回答问题来总结发现,回答主人公是如何打败反派的。'
]
给定原始问题、当前计划、过去的步骤以及迄今为止汇总的信息,更新计划 (这个类似于一个迭代用到的,一次计划无法完成任务,通过多次收集信息迭代)
定义任务处理程序 - 决定是使用哪个工具来处理计划中的每个任务
为了生成一个总体计划,不带任何基于任何先验知识的偏见LLM,我们首先对输入问题进行匿名化,并将名称实体映射到变量中
上面的串联起来
# 用户问题
state1 = {'question': "how did the harry beat quirrell? \n"}
print(f'question: {state1["question"]}')
# 脱敏
anonymized_question_output = anonymize_question_chain.invoke(state1)
## 脱敏后的问题和脱敏字段
anonymized_question = anonymized_question_output["anonymized_question"]
mapping = anonymized_question_output["mapping"]
print(f'anonimized_querry: {anonymized_question} \n')
print(f'mapping: {mapping} \n')
# 制定计划
plan = planner.invoke({"question": anonymized_question})
print(text_wrap(f'plan: {plan.steps}'))
print("")
# 计划的脱敏信息还原
deanonimzed_plan = de_anonymize_plan_chain.invoke({"plan": plan.steps, "mapping": mapping})
## 还原后的计划
print(text_wrap(f'deanonimized_plan: {deanonimzed_plan.plan}'))
# output
question:harry是如何打败Quirrell的?
anonimized_querry:X是如何打败Y的?
mapping:{'X': 'harry', 'Y': 'Quirrell'}
plan:[
'确定查询的上下文或领域(例如,体育、竞赛、游戏等)。',
'收集X和Y参加的事件或竞赛的信息。',
'找到X与Y竞争的特定实例或比赛。',
'查找那个特定实例或比赛的结果。',
'分析比赛的细节,以了解X是如何设法打败Y的。',
'总结解释X如何打败Y的关键点。'
]
deanonimized_plan:[
'确定查询的上下文或领域(例如,体育、竞赛、游戏等)。',
'收集harry和Quirrell参加的事件或竞赛的信息。',
'找到harry与Quirrell竞争的特定实例或比赛。',
'查找那个特定实例或比赛的结果。',
'分析比赛的细节,以了解harry是如何设法打败Quirrell的。',
'总结解释harry如何打败Quirrell的关键点。'
]
最后在加一个判断,确定是否能根据信息推出答案
整体的流程图如下:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-13
哈啰:构建智能出行RAG,ES还是向量数据库?
2025-01-13
企业级LLM独角兽 Cohere 发布 North:集成 RAG、搜索及 Agent 的企业级 AI 工作空间
2025-01-13
2025年这7种用于构建Agentic RAG系统的架构不可或缺
2025-01-13
RAG四种进阶方式
2025-01-13
使用RAG技术构建企业级文档问答系统:切分(3)使用Jina API进行语义切分
2025-01-13
使用RAG技术构建企业级文档问答系统:切分(2)使用Embedding进行语义切分
2025-01-12
RAG在智能问答系统中的应用
2025-01-12
CAG能取代RAG吗?别被表面现象迷惑!
2024-07-18
2024-09-04
2024-05-05
2024-06-20
2024-05-19
2024-07-09
2024-07-09
2024-06-13
2024-07-07
2024-07-07
2025-01-13
2025-01-09
2025-01-09
2025-01-09
2025-01-06
2025-01-04
2024-12-30
2024-12-27