微信扫码
添加专属顾问
我要投稿
探索AI如何通过记忆增强技术超越RAG,实现更精准的对话代理上下文理解。核心内容:1. RAG在AI领域的广泛应用及其局限性2. 人类记忆与RAG在情节背景上的根本差异3. 超越RAG,构建具有人性化记忆能力的AI对话代理
每周,我们都会看到有关检索增强生成(RAG)的新论文和新方法。RAG架构无处不在:图形RAG、GraphRAG、HybridRAG、HippoRAG,以及无数其他变体。AI社区已经将RAG视为解决大型语言模型(LLMs)许多局限性的潜在方案。然而,随着我们构建更复杂的AI系统,特别是与用户以复杂方式互动的对话代理,我们发现单靠RAG是不够的。
本文探讨了尽管RAG具有实用性,但其本质上与真正的记忆系统存在根本区别的原因,以及为什么我们需要超越RAG来开发具有更人性化记忆能力的AI。正如我们将看到的,记忆不仅仅是检索信息——它还涉及理解上下文、建立关联,以及,也许最重要的是,知道该忘记什么。
检索增强生成已成为现代AI系统中不可或缺的组成部分。RAG的核心工作原理是:
考虑一个简单的例子:用户询问:“巴黎气候协议的主要成果是什么?”标准的LLM可能会根据其训练数据提供一个一般性答案,这些数据可能已经过时或不完整。然而,增强RAG的系统会首先在其知识库中搜索关于巴黎气候协议的具体文档,提取相关段落关于其成果,然后利用这些检索到的信息生成更准确和最新的响应。
RAG在许多应用中已被证明非常有效,特别是在构建AI驱动的搜索能力或处理需要提供给LLM的大量数据时。它有助于将AI的响应建立在事实信息的基础上,并减少幻觉——模型生成看似合理但不正确的信息的实例。
例如,当Meta推出其基于RAG的Llama 2系统时,他们报告称,与基础模型相比,幻觉率降低了20%到30%。同样,实施RAG架构以用于客户服务应用的公司在对特定产品或政策问题的响应准确性上也取得了显著改善。
正如一位RAG开发者所说:“如果你在构建AI驱动的搜索,也许RAG是一个不错的方法,但如果你在构建代理或对话代理或其他更复杂的与用户互动的东西,RAG就不够了。”
这种局限性在我们超越简单的问答,进入需要持续互动、个性化和适应变化上下文的更复杂场景时变得显而易见。
尽管RAG具有实用性,但在几个根本方面与人类记忆不同:
在人的记忆中,信息并不是孤立存在的。事实总是与相关事件、生活经历和其他上下文元素交织在一起。这种情节背景赋予事实更丰富的意义,并帮助我们更全面地理解它们。
想想你从教科书中学到的历史事实与通过强有力的纪录片或博物馆参观所经历的事实之间的理解差异。情感影响、视觉背景和叙事结构都对你储存和回忆这些信息的方式产生了影响。这种丰富的上下文元素交织在一起,使得人类记忆如此强大而细腻。
例如,如果你通过一部包含与经历了数十年分离后重聚的家庭访谈的纪录片了解到柏林墙的倒塌,你对这一历史事件的记忆将与所听到的情感故事交织在一起。当你稍后回忆有关柏林墙的事实时,这些情感元素也可能被激活,从而提供更丰富、更具上下文的理解。
正如演示中所解释的:
"信息并不是孤立存在的——它不是百科全书式的知识。它总是与相关的事件、生活经历和其他事物交织在一起。你需要有情节记忆和背景,才能对事实有更丰富的解读。"
RAG 系统通常仅基于语义相似性或相关性排名来检索信息,剥夺了这一关键的情节背景。一个 RAG 系统可能会检索出一段说明柏林墙何时倒塌的文字,但它无法获取塑造人类理解和关联这些信息的情感或体验背景。
当前的 RAG 实现将文档视为孤立的信息单元,未能捕捉它们与特定经历、对话或互动的关系。这意味着虽然 RAG 可以提供事实信息,但缺乏情感共鸣和个人相关性,这使得人类记忆在学习和决策中如此有效。
我们的脑海通过复杂的联想网络来组织记忆。当你的大脑检索有关红色的信息时,它可能会自动检索与之相关的概念,如橙色或其他语义相关的项目。这些联想机制是我们思考和推理的基础。
考虑一下当你想到“海滩”时会发生什么。你的脑海可能会激活一整套相关概念的网络:沙子、海洋、防晒霜、假期、你曾访问过的海滩的具体记忆、阳光洒在皮肤上的感觉、海浪的声音。这些联想不仅仅是语义上的——它们跨越感官模式、情感、个人经历和抽象概念。
"你的语义记忆有一组一起检索的记忆包,因为它们在语义上是相近的。如果你的大脑检索到有关红色的内容,它也会检索到与橙色和其他相关事物——这就是我们大脑的组织方式。"
这种联想结构允许创造性的连接和洞察,远远超越简单的信息检索。你可能会在海浪的节奏和你正在创作的音乐作品之间建立意想不到的联系,或者在海滩侵蚀模式和你试图解决的商业问题之间建立联系。
当前的 RAG 系统难以复制这种丰富的联想结构。即使是试图捕捉文档或概念之间关系的图形化方法,通常也依赖于预定义的连接类型或简单的共现统计。它们缺乏人类记忆所特有的多维度、跨模态的联想。
例如,一个 RAG 系统可能会基于“海滩”和“海洋”的语义相似性将包含这些词的文档关联起来,但除非明确编程,否则它不会自动与相关的感官体验、情感状态或抽象概念建立联系。
虽然基于图形的 RAG 方法试图模拟这种联想结构,但仍然无法达到人类记忆中丰富的多维联想。在 AI 系统中构建有效的联想性仍然是一个重大挑战。
RAG 最显著的局限性或许在于它的检索是没有理解的。正如演示中提到的:“你可以检索一些文档,可以构建 BM25 排序或其他排名信息和相关性的方法,但你仍然不理解你所检索的内容。”
考虑一个回答气候变化问题的 RAG 系统。它可能会检索并结合来自多篇科学论文、政策文件和新闻文章的信息。该系统可以找到包含相关关键字的文档,甚至使用像 BM25 或神经嵌入这样的复杂算法按相关性对其进行排名。然而,它并不真正理解这些文档中讨论的科学概念、因果关系或政策含义。
这种缺乏理解在处理微妙话题时尤为明显。例如,如果被问及气候变化与极端天气事件之间的关系,RAG 系统可能会检索到陈述统计相关性的段落,而无法掌握潜在的因果机制或关于归因的科学辩论。它可能会将来自不同来源的矛盾信息并列,而没有意识到这种矛盾。
让我们看看一个更具体的例子:如果一个 RAG 系统被问到“碳定价如何影响工业竞争力?”,它可能会检索提到碳定价和工业竞争力的文档。然而,没有真正的理解,它无法独立评估不同研究的方法质量,识别行业资助的研究可能存在的偏见,或理解潜在的经济机制。它仅仅是在匹配模式,而没有理解。
RAG 系统可以根据各种指标查找和排名信息,但它们并不一定以人类的方式理解所检索的内容。自然语言理解仍然是一个巨大的挑战,缺乏它,RAG 仅仅是在无意识地打乱符号,而没有抓住它们的含义。
反直觉的是,人类记忆中最重要的一个方面是我们遗忘的能力。“我们的大脑并不是为了记住事情——我们的脑更像是为了遗忘事情。我们是遗忘机器。”
这种遗忘机制对于心理健康和认知功能至关重要。当它失效时,我们可能会经历 PTSD 和其他心理健康挑战。目前的 RAG 系统通常没有包含原则性的遗忘机制,以优先考虑重要信息,同时丢弃无关信息。
考虑当你搬到一个新城市时会发生什么。随着时间的推移,你逐渐忘记了旧邻里的详细布局——每个商店的位置、次要街道的名称——而保留重要的信息和情感记忆。这种选择性遗忘是至关重要的;没有它,导航你的新环境将充满来自过去的无关信息。
类似地,当你换工作时,你逐渐忘记了旧工作场所日常流程的具体细节,同时保留了在那里获得的宝贵技能和知识。这种遗忘是适应性的,使你能够专注于新角色,而不会被过时的程序所压倒。
相反,当前的 RAG 系统通常会无限期保留所有信息。它们可能会随着时间的推移给某些文档分配较低的相关性评分,但它们没有真正“遗忘”过时或无关信息的机制。这可能导致几个问题:
“想象一下,有一个朋友从不忘记任何事情——与他们建立关系会相当复杂。”同样,缺乏遗忘机制的对话代理随着时间的推移可能变得笨拙,因为它们保留了每一条信息,无论其当前的相关性如何。
例如,想象一个客户服务 AI,它记住客户与公司之间的每次互动,追溯到多年前。如果没有适当的遗忘机制,它可能会不断提及遥远过去的已解决问题或应用过时的政策。这将为客户创造一种令人沮丧的体验,并降低 AI 系统的有效性。
除了作为记忆系统的概念局限性外,RAG 还面临几种实际挑战,这些挑战限制了其构建真正先进的 AI 的有效性:
即使在检索的情况下,LLM 也受到其上下文窗口的限制。复杂的推理需要从许多来源综合信息,这可能超出这些限制。
考虑一个法律助理 AI,帮助准备涉及数百个先前案例、法规和法律意见的案件。即使 RAG 系统能够识别相关文档,语言模型的上下文窗口可能一次只能容纳其中的一小部分信息。这迫使人工对信息进行分块,可能会破坏重要的联系,并限制系统在相关材料的全范围内进行推理的能力。
类似地,想象一个需要考虑患者整个病史、相关医学文献、类似案例研究和当前症状的医疗诊断系统。上下文窗口限制施加的碎片化可能会阻止系统在遥远但相关的信息片段之间建立联系。
这些限制在我们从简单的事实检索转向复杂的推理任务时变得越来越成问题。尽管上下文窗口已经大幅增长——从早期 GPT 模型中的 2,048 个标记到最近系统中的 32,000 个或更多——但它们仍然施加了人类记忆所不面临的人工限制。人类可以在需要时无缝整合几十年前的经验信息,而不受我们可以同时考虑的上下文数量的任意限制。
一些研究人员提出了滑动窗口方法或递归摘要技术来解决这些限制,但这些变通方案引入了自己的问题,包括潜在的细节丢失和计算开销增加。
RAG 的有效性取决于其检索组件。糟糕的检索——无论是由于索引不足、查询不精确,还是知识库内容不足——都会导致生成质量不佳。
这在处理细微查询时尤其明显。例如,如果用户询问:“使用预测算法进行刑事判决的伦理影响是什么?”,响应的质量完全取决于系统是否能够检索到专门针对伦理维度的文档,而不仅仅是关于预测算法的技术方面或刑事判决的一般信息。
检索挑战在处理以下情况时加剧:
当前的 RAG 系统通常在这些挑战中挣扎。向量相似性搜索虽然强大,但可能会错过使用不同术语或从不同角度接近主题的相关信息。结合语义搜索和关键字匹配的混合检索系统有助于解决其中的一些问题,但仍然未能达到人类对信息需求的理解。
大多数 RAG 实现使用固定的向量表示,这些表示不会根据新的理解或信息之间的联系而演变。
考虑人类对概念的理解是如何随着时间而发展的。当你第一次学习像量子物理这样复杂的主题时,你可能会形成一个基本的心理模型。随着你学习更多,这个模型变得更加细致,并与其他知识相互关联。当你在不同的上下文和应用中遇到“叠加态”或“纠缠”等术语时,你的理解也在不断演变。
相比之下,大多数 RAG 系统将文档表示为静态向量,一旦创建就不会改变。如果出现新的信息改变了现有文档的意义或重要性,系统不会自动更新其表示以反映这些变化。
例如,一个包含医学信息的 RAG 系统可能有关于特定治疗方法的文档。如果新的研究表明这种方法无效或有害,系统不会自动更新现有文档的向量表示,以反映它们作为过时或有争议信息
正如演示中提到的:“RAG没有自我反思和自我改进的功能。”没有评估所检索信息的质量和相关性的能力,RAG系统无法迭代地提高自身的性能。
人类的记忆和认知涉及持续的自我监控和评估。当我们试图回忆信息时,我们会感知到我们的回忆是否准确或完整。我们可以识别知识的空白,或识别何时需要寻求额外的信息。这种元认知意识对于有效的学习和解决问题至关重要。
例如,当医生在为有异常症状的患者诊断时,他们可能会意识到这种模式并不完全符合他们熟悉的任何病症。这种意识促使他们查阅额外的资源,寻求专家的意见,或考虑一些他们通常不会包括在鉴别诊断中的罕见病症。
当前的RAG系统缺乏这种自我意识。当它们检索到与查询仅有间接关系的信息时,通常没有机制来识别这种不匹配或相应地调整其检索策略。它们无法识别知识库中的空白,也无法识别所检索的信息不足以回答问题的情况。
一些先进的RAG实现方案结合了相关性反馈或不确定性估计,但这些方法仍远远不及人类的元认知能力。没有这种自我反思,RAG系统无法有效地从错误中学习或根据过去的表现调整其策略。
要超越RAG,朝着更具人类特征的AI记忆发展,我们需要包含以下内容的系统:
人类记忆在不同的模态、语言和信息类型之间运作。先进的AI记忆系统需要“丰富的结构化表示和对事物的理解”,可能包括多语言结构,其中不同语言可以表示相同的概念。
我们的记忆并不局限于单一的格式或模态。我们记住面孔、声音、气味、情感、事实、程序和叙述——所有这些都是通过相互关联但又独特的记忆系统实现的。这些模态中的每一个都为我们经历和知识的丰富多维表示做出了贡献。
考虑一下你如何记住童年的生日派对。你可能会回忆起:
这些不同类型的信息通过不同但相互关联的记忆系统进行存储和访问。当一个元素被激活时,它通常会触发跨模态的相关记忆。
当前的AI系统,包括RAG,通常在单一模态内运作——通常是文本。即使它们处理多种模态,如图像和文本,它们也通常将所有内容转换为单一的表示格式(如嵌入向量),这会丧失不同类型信息的独特特征。
例如,关于海滩日落的记忆包含视觉成分(天空的颜色、沙子的纹理)、听觉成分(海浪的声音)、情感成分(平静或敬畏的感觉),以及可能的语义成分(关于日落为何有特定颜色的知识)。一个真正的多模态记忆系统将保留这些独特的方面,同时维护它们之间的相互联系。
先进的AI记忆系统应支持:
在这方面,一些有前景的研究包括多模态变换器、跨模态检索系统和结合神经表示与符号推理的神经符号架构。
“回忆是主动构建——我们提取记忆并即时构建它们。”例如,海马体负责时间线和时间的重构。这个主动构建过程使我们能够模拟未来并思考可能性。
人类记忆并不像视频录制那样精确播放所存储的内容。相反,它是一个重构的过程。当我们记忆时,我们并不是简单地检索一个完整的记忆;我们是从碎片中重构它,根据图式、期望和相关记忆填补空白。
考虑一下当你回忆起上周的一次对话时会发生什么。你并不记得每一个字的逐字内容。相反,你重构了所说内容的要点,或许准确记住了几个关键短语。你根据对谈话对象的理解、对话的背景以及你对讨论主题的知识来填补空白。
记忆的这种重构特性有几个重要的启示:
当前的RAG系统缺乏这种重构特性。它们检索现有的文本段落,但并不主动重构信息以适应当前的上下文或填补检索到的碎片之间的空白。它们可以组合或总结检索到的段落,但这远未达到真正的重构记忆。
例如,如果被问及气候变化的某个特定方面,而该方面在其知识库中的任何单一文档中都没有直接涉及,RAG系统可能会检索几个相关的文档,但难以重构所需的具体信息。相比之下,人类专家可能会通过结合来自不同来源的知识碎片来重构答案,根据对该领域的总体理解填补空白。
虽然这有时可能导致虚假记忆,但这种主动重构对于真正先进的记忆系统至关重要。没有它,我们只有简单的检索,而不是真正的记忆。
先进的AI记忆系统应包含:
最近关于生成检索模型和神经图式网络的研究在这方面显示出希望,但要实现真正类人重构记忆仍需大量工作。
记忆应该是联想性的,在相关概念之间建立丰富的语义联系。这些联想使得推理更加灵活,更加类似于人类的思维方式。
人类的记忆本质上是联想的。概念、经历和事实通过复杂的联想网络相互连接,使得信息的灵活提取和创造性联系成为可能。与传统计算机存储系统的刚性层级组织不同,联想记忆使我们能够通过多条路径访问信息,并进行意想不到的连接,从而引发洞察和创新。
考虑一下你是如何检索关于“巴黎”的信息的。根据上下文,你可能通过以下方式访问这些信息:
这些丰富的多维联想使得信息的提取更加灵活且适合上下文。如果你正在计划一次旅行,你的大脑可能会激活与旅行相关的联想;如果你在讨论艺术史,它可能会激活艺术相关的联想。
当前的RAG系统通常依赖于基于相似性的检索,这缺乏这种丰富的联想结构。文档可能基于与查询的整体相似性被检索,但系统并没有保持不同信息片段之间的明确联想,这可能使得更灵活和创造性的检索路径成为可能。
例如,如果用户询问“创新的城市交通解决方案”,传统的RAG系统可能会检索包含相似术语的文档。联想记忆系统可以激活一个相关概念的网络——自行车共享项目、拥堵收费、自动驾驶汽车、城市规划原则——即使这些在查询中并没有被明确提及。
先进的AI记忆系统应当包含:
关于图神经网络、联想记忆模型和知识图谱的研究为构建这样的系统提供了有希望的方向,但创造真正类似人类的联想记忆仍然是一个重大挑战。
“没有遗忘,记忆根本无法运作。”遗忘与注意力密切相关——决定哪些信息值得关注,哪些可以被丢弃。
与普遍看法相反,遗忘并不仅仅是记忆的失败——它是一种适应性特征,帮助我们在复杂变化的世界中有效运作。通过选择性地保留重要信息,同时丢弃无关信息,我们的记忆系统优化了实用性,而不是完美的回忆。
考虑一下如果你记住了过去五年每天通勤的每一个细节——你经过的每一辆车、你看到的每一个行人、你路线的每一个细微变化,会发生什么。这些信息会淹没你的记忆系统,干扰你回忆真正重要信息的能力。相反,你的大脑聪明地保留稳定的重要特征(大致路线、显著地标),同时丢弃无关的细节。
遗忘有几个重要功能:
当前的RAG系统通常缺乏原则性的遗忘机制。它们可能实施简单的基于时间的衰减或相关性阈值,但这些远远不及人类记忆中复杂的、上下文敏感的遗忘过程。
例如,使用RAG的对话AI可能会无限期地保留过去对话的每一个细节,随着知识库的增长,导致越来越无关的检索。如果没有自适应遗忘,系统可能会继续检索关于用户过去兴趣或需求的信息,即使这些信息已经发生了重大变化。
先进的AI记忆系统应当包含:
最近关于具有控制遗忘、适应性记忆网络和记忆优化的强化学习方法的神经网络的研究在这一方向上显示出希望。
记忆系统应该是层次化的,以表示我们的语义层次结构,允许不同的抽象和概念化级别。
人类记忆同时在多个抽象层次上运作。我们可以放大以回忆具体细节,或缩小以访问一般原则和类别。这种层次组织允许高效存储、灵活检索和强大的概念化能力。
考虑一下你对动物知识的组织方式:
这种层次结构使你能够:
当前的RAG系统通常缺乏这种丰富的层次组织。虽然它们可能使用聚类或分类方案来组织文档,但这些方法通常无法捕捉到人类概念知识所特有的嵌套多层次层次结构。
例如,如果用户询问“欧洲城市的交通选择”,传统的RAG系统可能会检索包含这些术语的文档。一个层次组织的记忆系统可以识别特定交通方式(公交车、有轨电车、地铁)、特定城市(巴黎、柏林、巴塞罗那)之间的关系,以及它们所体现的一般概念,从而允许更细致和全面的回答。
先进的AI记忆系统应包含:
关于层次神经网络、概念格和基于本体的知识表示的研究为构建此类系统提供了有希望的方向。
几种方法显示出开发更复杂的AI记忆系统的潜力:
RAG 代表了向更强大的 AI 系统迈出的重要一步,这些系统能够访问外部知识。然而,将 RAG 等同于记忆未能体现人类记忆系统丰富、动态和综合的特性。
在我们努力开发更先进的 AI,特别是与人类以复杂方式互动的对话代理和系统时,我们需要超越简单的检索。我们需要开发能够真正记忆、反思和从经验中学习的系统——这些系统理解上下文、关联甚至遗忘的重要性。
考虑以下两者之间的区别:
第一个是检索;第二个是真正的记忆。随着 AI 系统越来越多地融入我们的生活和工作,我们需要它们更像同事而不是搜索引擎。
这并不意味着要放弃 RAG——它仍然是将 AI 系统与事实信息结合的有价值工具。但这确实意味着要认识到它的局限性,并努力用更复杂的记忆机制来补充它,以捕捉人类记忆的主动、构造、关联和适应特性。
信息很明确:如果你想构建真正先进的东西,就要考虑记忆系统,而不仅仅是检索系统。RAG 不够——它仅仅是我们朝着具有真正类人记忆能力的 AI 系统旅程的开始。
本文结合了关于 AI 记忆系统的技术演示的见解以及关于 RAG 的局限性和更复杂的 AI 记忆需求的额外研究。该领域仍在快速发展,可能会出现新的 AI 记忆方法,以解决讨论的局限性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-16
2025-04-14
2025-04-13
2025-04-11
2025-04-09
2025-04-07
2025-04-05
2025-04-04