我要投稿

RAG检索：最新研究成果，内存MemLong增强检索

发布日期：2024-09-06 08:35:09 浏览次数： 2047

作者：AI技术研习社

微信搜一搜，关注“AI技术研习社”

在这篇文章中，作者介绍了 MemLong：用于长文本生成的记忆增强检索（MemLong），一种旨在通过利用外部检索器进行历史信息检索来增强长上下文语言建模能力的方法。

大型语言模型(LLMs)近年来在各个领域取得了显著成功，但在处理长文本方面仍面临着严峻挑战。这些挑战主要源于两个方面：注意力机制的计算复杂度和生成过程中的内存消耗。

传统的注意力机制具有二次时间和空间复杂度，可表示为：O(n^2)，其中n为序列长度。这导致在处理长序列时计算资源需求呈平方增长。同时，在生成过程中，模型需要缓存key-value对，其内存占用随序列长度线性增长。

对于检索增强生成（RAG）来说，当检索到的信息长度超过模型的处理能力时，RAG甚至可能会降低生成性能（黄色）。

面对上述挑战，本研究的主要目标是开发一种能够有效处理长文本的语言建模方法，同时在扩展上下文长度的同时保持模型在短文本上的性能，并提供一种计算效率高、易于实施的解决方案。MemLong 的内存和检索过程如下图所示：

关键思想：

提出 MemLong，一种高效、轻量级的方法，用于扩展 LLMs。
这个想法是将过去的上下文和知识存储在一个不可训练的内存库中，并进一步利用这些存储的嵌入来检索块级键值（K-V）对，以便输入到模型中。
MemLong 适用于任何仅限解码器的预训练语言模型，方法是包含用于内存和检索的附加 ret-mem 组件和用于集成局部和内存信息的检索因果注意力模块。

MemLong，结合一个非可微分的检索-记忆模块和一个部分可训练的解码器语言模型，来增强长文本上下文的语言建模能力。

MemLong利用外部检索器来检索历史信息，并通过细粒度、可控的检索注意力机制，将语义级别的相关信息块整合到模型中。这种方法不仅提高了模型处理长文本的能力，还保持了信息分布的一致性，避免了训练过程中的分布偏移问题。

MemLong的一个示例：在底层，模型保持静态，对整个数据块Ci进行因果语言建模，随后，Ci被缓存为嵌入和键值对（K-V）形式。最后，上层进行微调，以协调检索偏好并整合检索到的内容。

论文：https://arxiv.org/pdf/2408.16967

代码：https://github.com/Bui1dMySea/MemLong/blob/main/run_clm_no_trainer.py

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-14

亲测成功！小白用AI工具0代码搭建RAG问答系统全过程揭秘

2025-07-14

RAG（检索增强生成）科普介绍

2025-07-14

文档太长模型“吃不下”？15种Chunking神技，助你打造聪明绝顶的RAG系统！

2025-07-14

RAG检索不准？99%的人都忽略了这一步！

2025-07-14

RAG 的性能评估

2025-07-12

OpenAI 无需向量化的RAG新范例：探索大模型时代的高效知识问答与模型选择之道

2025-07-11

Rag评估框架

2025-07-11

详解RAG评估指标与评估方法

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

MCP与RAG，and 让我们用MCP的Tool莽穿一切！

2025-04-16

深度解读：LlamaIndex 实现 RAG 重排序的关键要点

2025-05-08

RAG进阶：Embedding Models嵌入式模型原理和选择

2025-04-23

RAG技巧与底层代码剖析

2025-06-06

2025年GitHub上十大RAG框架深度解析：从技术原理到实战应用

2025-05-30

深度拆解RAGFlow分片引擎之切片实现

2025-04-16

淘天⾃营质量技术AI智能体的实践和思考

2025-05-19

RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析

2025-06-05

RAG技术全解析：从基础原理到优化实战

2025-06-05

大家都在问

AI大模型落地最后一公里：RAG？

2025-07-09

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-07-01

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

你的RAG系统安全么？

2025-06-29

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB