我要投稿

三个最新RAG前沿思路分解：从Astute RAG减少检索噪声到Retriever-and-Memory自适应检索迭代生成

发布日期：2024-10-17 11:51:02 浏览次数： 2211 作者：老刘说NLP

今天是2024年10月17日，星期四，北京，天气阴。

来回顾下昨日大模型早报，社区日常互动，欢迎加入。

我们来看看最近的三个RAG进展，包括Astute RAG、StructRAG、Retriever-and-Memory等几个工作，有些思路很有趣，可看看。

供大家一起参考并思考。

一、Astute RAG减少检索噪声

不太好的检索结果可能引入无关、误导甚至恶意信息；LLMs内部知识与外部知识之间的潜在冲突；如何在RAG的后检索阶段有效解决这些冲突。

对于这类问题，之前已有一些工作，例如提高RAG系统鲁棒性的各种方法，如训练LLMs以应对噪声上下文、过滤无关段落、重排段落、动态和迭代检索、查询重写等。

最近的工作《Astute RAG: Overcoming Imperfect Retrieval Augmentation and Knowledge Conflicts for Large Language Models》(https://arxiv.org/abs/2410.07176)，提到一个自适应的方式，来看看其实现思路：

1、自适应生成内部知识

首先，从LLMs的内部知识中自适应地生成信息，以补充检索到的段落。这部分利用LLM生成与给定问题相关的准确、相关且无幻觉的段落。

为了确保生成的段落具有高可靠性和准确性，ASTUTE RAG提供宪法原则来指导生成过程，强调生成的段落应该是准确的、相关的且无幻觉的。

M表示LLM，pgen是提示模板，q是问题，m^是生成的最大段落数。

此外，LLM可以自行决定生成多少段落，而不是固定数量的段落，这允许LLM在内部知识有限时生成较少的段落，而在有多个可行答案时生成更多段落。

2、源感知的知识整合

其次，将内部和外部知识进行整合。初始时，将检索到的段落和内部生成的段落合并，并为每段提供来源信息。

然后，通过提示LLM识别一致的信息、检测冲突信息并过滤无关信息。

3、答案的最终确定

最后，根据每组一致段落的可靠性生成最终答案。通过比较不同段落组的答案，选择最可靠的一个作为最终答案。

不过，在最坏情况下，ASTUTE RAG的表现接近于无检索增强（No RAG）的情况。

二、StructRAG引入结构化分流处理

现有的RAG方法在处理知识密集型推理任务时面临挑战，因为这些任务所需的信息分散在文档中，导致模型难以准确识别关键信息并进行全局推理。

《StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization》，https://arxiv.org/abs/2410.08815

先说不足，这个工作YY现象很严重，因为在实际场景中很难会说这个东西应该使用来自于哪个数据，这个路由可能本身就不成立，并且还需要针对不同的类型做处理，这个时延性是很难接受的。

由于缺乏用于选择最佳结构类型的偏好数据，虽然设计了一种合成-模拟-判断的方法来构建训练数据。这种方法虽然有效，但在实际应用中可能面临数据质量和多样性的问题。

此外，尽管混合结构路由器在选择最佳结构类型方面表现良好，但原始LLM在没有特殊训练的情况下仍然难以选择最优的知识类型。

最后，使用单一的固定结构类型（如表格、图表、文本块等）在多样化的任务中表现不佳。这验证了混合信息结构化的重要性，但也增加了系统的复杂性。

之后，我们来看看其具体实现细节，StructRAG包括一个混合结构路由器、一个分散知识结构化器和一个结构化知识利用器，其中，混合结构路由器用于根据任务需求选择最优的结构类型；分散知识结构化器：将原始文档转换为所选结构类型的结构化知识；结构化知识利用器：分解复杂问题并使用结构化知识进行答案推断。

1、混合结构路由器

首先，混合结构路由器，用于根据任务需求选择最合适的结构类型。

该路由器利用问题和文档的核心内容来决定最佳结构类型。

其中，q 是问题，C 是文档的核心内容容，t是选择的结构类型。

可以看其具体实现策略：

首先，从文档中提取每篇文档的核心内容，通常是标题或前几个句子。

然后，根据提取的核心内容和问题，混合结构路由器选择最适合的结构类型。结构类型包括表格（用于统计任务）、图表（用于长链任务）、算法（用于规划任务）、目录（用于总结任务）和文本块（用于简单单跳任务）。

此外，为了提高混合结构路由器的选择能力，基于DPO进行训练。

2、分散知识结构化器

其次，使用基于LLM的分散知识结构化器将原始文档转换为结构化知识。

该结构化器利用LLM的理解和生成能力，从文档中提取结构化知识。

其中，q是问题，t是选择的结构类型，d (i)是第i篇文档，kt(i)是提取的结构化知识，bt(i)是结构化知识的描述。

具体实现上，

首先，分散知识结构化器接收问题、选择的结构类型和每篇原始文档作为输入。

其次，利用LLM的强大理解和生成能力，结构化器从文档中提取结构化知识。不同类型的信息（如表格、图表、算法等）需要不同的处理方式。例如，表格可以通过解析Markdown格式生成，图表可以通过提取实体-关系三元组生成，算法可以通过伪代码表示，目录可以通过分层编号表示。这里涉及到不同的文档的结构化处理prompt，简单粗暴：

1）Prompts in Constructing Table

2）Prompts in Constructing Graph

3）Prompts in Constructing Algorithm

4）Prompts in Constructing Catalogue

最后，除了提取结构化知识外，结构化器还会生成结构化知识的描述，以便于后续的利用和推理。

3、结构化知识利用器

最后，使用基于LLM的结构化知识利用器将复杂问题分解为简单的子问题，

并通过结构化知识进行精确的知识提取和最终答案推理。

对应的prompt如下：

三、Retriever-and-Memory自适应检索迭代生成

现有的RAG方法在复杂问答任务中往往无法收集到足够的信息。Adaptive RAG（ARAG）尝试通过自适应地决定“何时何地检索”来捕捉更多有价值的知识，但仍存在一些局限性。

最近的工作《Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation》，http://arxiv.org/pdf/2410.08821v1。

先说存在不足的点：

首先，在自适应过程中，检索次数被限制在15次以内，这可能会影响在某些情况下获取更多有用信息的能力。

其次，虽然实验中使用了默认的参数设置，但自适应记忆审查器的触发条件（如无效更新次数、收集迭代次数和去重检索段落数）可能需要进一步调整以优化性能。

最后，长尾知识的处理，某些查询可能对应于语料库中的大量长尾知识片段，这些片段在多次迭代后可能会增加笔记的信息量，但也可能导致不必要的噪声。

我们再来看看实现细节，可以看其构成模块。

1、迭代信息收集器（IIC）

初始阶段，基于查询和检索到的段落生成初始笔记作为初始记忆。

迭代阶段，利用当前最优记忆和原始查询生成新的查询，并检索新的段落更新笔记。

首先，使用BM25或DPR检索器从语料库中检索与问题相关的段落，并将其作为初始记忆存储在LLM中。

然后，迭代地利用当前记忆和原始问题生成新的查询，并检索新的参考段落，更新记忆。

这几个部分，对应的prompt如下：

2、自适应记忆评审器（AMR）

评估更新后的笔记和当前最优记忆的内容质量，决定是否将更新后的笔记替换为新的最优记忆。同时，设置停止条件以控制信息收集的迭代次数。

涉及到两个子问题：

对于决定存储什么作为最优记忆：AMR通过多维评估当前笔记和最优记忆的内容质量，决定是否需要更新记忆。具体来说，AMR比较笔记和记忆的内容质量，如果笔记内容更优，则替换记忆内容。

评估标准包括：信息是否包含与问题直接相关的关键信息、信息是否具有多个方面、信息是否包含足够的细节、信息是否实用

对应的prompt:

对于，决定何时停止检索：AMR建立了三个停止条件来控制信息收集的进程：无效更新次数、最大信息收集步数和最大去重检索段落数。满足任意一个条件都会触发迭代过程的终止。

3、任务导向生成器（Generator

利用最优记忆作为上下文，通过LLM的零样本上下文学习（ICL）生成最终答案。

最后，生成器根据最优记忆生成最终答案。针对不同任务的输出风格，设计了相应的提示模板，确保生成高质量的答案。

4、一个具体实例

我们可以看看一个具体实例，看下执行过程：

总结

本文主要看了最近的三个RAG进展，包括Astute RAG、KRAG Framework、StructRAG、Retriever-and-Memory等几个工作，可以看到，这些工作很臆想，实操性和落地性并不强，但思路可供阅读，清一色的拟合思路。

批判的看，会更有收获。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

深度学习！构建基于LangGraph的RAG多智能体研究工具。

2025-04-26

用RAG与Agent提升企业问答效率：我的AI实践之路

2025-04-26

理解 RAG 第一部分：为什么需要它

2025-04-26

理解 RAG 第三部分：融合检索与重新排序

2025-04-26

理解 RAG 第四部分：检索增强生成评估框架

2025-04-26

理解 RAG 第五部分：管理上下文长度

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

【Ragflow】21.RagflowPlus(v0.2.1)：6个bug修复/增加重置密码功能

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB