微信扫码
与创始人交个朋友
我要投稿
检索增强生成(RAG)技术在许多基于知识的任务中有效增强 LLMs,但在知识密集型推理任务中面临挑战。现有RAG方法难以准确识别关键信息并进行全局推理。本文提出了一种新的框架
StructRAG
,旨在通过推理时混合信息结构化来增强 LLMs 在知识密集型推理任务中的表现。它能够根据任务需求识别最佳结构类型,将原始文档重构为该结构格式,并基于该结构进行答案推断。
StructRAG框架致力于解决知识密集型推理任务中的信息分散问题,具体方法包括:
1. 混合结构路由器:根据任务需求选择最适合的结构类型。此路由器利用问题和文档的核心内容来决定最佳结构类型。其工作原理如下:
其中,(C) 是选择的结构类型。
混合结构路由器的工作原理
a.核心内容提取:从文档中提取每篇文档的核心内容,通常是标题或前几个句子。
b.结构类型选择:根据问题和文档的核心内容,从五种候选结构类型中选择最合适的一种:表格(统计任务)、图表(长链任务)、算法(规划任务)、目录(总结任务)和文本块(简单单跳任务)。
c.训练方法:采用基于 DPO算法 的训练方法,通过合成-模拟-判断的管道构建训练数据,使模型学习如何选择合适的数据结构类型。
2. 分散知识结构化器:将原始文档转换为结构化知识。该结构化器利用LLM的理解和生成能力,从文档中提取结构化知识。具体的公式为:
这里,是问题,是选择的结构类型,是第篇文档,是提取的结构化知识,是结构化知识的描述。
3. 结构化知识利用器:将复杂问题分解为简单的子问题,并通过结构化知识进行精确的知识提取和最终答案推理。具体的公式如下:
4. 混合结构路由器的训练:
本文提出了一种新的框架StructRAG,通过混合信息结构化机制来构建和利用结构化知识,从而有效解决知识密集型推理任务中的信息分散问题。StructRAG包括一个混合结构路由器来精确选择最佳结构类型,然后是一个散布知识结构化器将原始文档转换为结构化知识,最后是一个结构化知识利用器来分解复杂问题并通过构建的结构化知识推断出最终答案。此外,为了获得高性能的混合结构路由器,我们通过合成-模拟-评判流程构建训练数据,然后通过DPO算法实现偏好训练。实验结果表明,StructRAG在多个知识密集型任务中取得了SOAT的性能,尤其在任务复杂性增加时,性能提升更为显著。本文提出了一种有前景的方向,专注于混合结构化知识,以在未来开发更强大的RAG系统。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-05
15种典型RAG框架:卡内基梅隆大学最新RAG综述
2024-11-05
Claude发布新的RAG方法 --- 通过上下文嵌入与BM25结合显著降低数据块检索失败率
2024-11-05
【大模型】深度解析:智能体如何突破 RAG 的三大技术瓶颈
2024-11-05
RAG 系统的分块难题:小型语言模型如何找到最佳断点?
2024-11-05
Adaptive-RAG:通过问题复杂性学习自适应检索增强LLM
2024-11-05
打造自己的RAG解析大模型:Labelme版面标注并顺利完成训练
2024-11-04
实操|如何优雅的实现RAG与GraphRAG应用中的知识文档增量更新?
2024-11-04
DSPy还能整RAG的活?LeReT: 用强化学习实现LLM智能检索
2024-07-18
2024-07-09
2024-07-09
2024-05-19
2024-05-05
2024-07-07
2024-07-07
2024-06-20
2024-07-08
2024-07-09
2024-11-05
2024-11-04
2024-10-27
2024-10-25
2024-10-21
2024-10-21
2024-10-15
2024-10-15