我要投稿

介绍了 HippoRAG

发布日期：2024-06-09 07:22:24 浏览次数： 2304 作者：芝士AI吃鱼

原文：
HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models

引言

在人工智能领域，尤其是自然语言处理（NLP）中，大型语言模型（LLMs）的长期记忆能力一直是研究的热点和难点。人类大脑能够在不断变化的环境中存储和更新大量知识，而现有的LLMs在预训练后整合新经验时仍面临挑战。为了解决这一问题，本文介绍了HippoRAG，这是一种新颖的检索框架，灵感来源于人类长期记忆的海马索引理论，旨在实现更深层次、更高效的知识整合。

研究背景与动机

LLMs在处理多跳问题时，如科学文献回顾、法律案例摘要和医学诊断等，需要跨文档整合知识。然而，现有的检索增强生成（RAG）方法在处理这类任务时，由于每次编码新篇章时都是孤立的，因此难以实现跨篇章的知识整合。HippoRAG的提出正是为了克服这一限制，通过模仿人类大脑中新皮层和海马体的不同角色，提高LLMs在多跳问答等任务中的表现。

HippoRAG方法详解

海马记忆索引理论

HippoRAG的设计灵感来源于海马记忆索引理论，该理论认为人类的长期记忆由三个组成部分协同工作：模式分离和模式完成。模式分离确保不同感知经验的表示是独特的，而模式完成则从部分刺激中检索完整的记忆。

离线索引

HippoRAG的离线索引阶段类似于记忆编码过程，使用一个指令调整的大型语言模型（LLM）作为人工新皮层，通过开放信息提取（OpenIE）从检索语料库中的篇章中提取知识图谱（KG）三元组。这个过程提取出篇章中的显著信号作为离散名词短语，而不是密集的向量表示，从而实现更细粒度的模式分离。

在线检索

在线检索阶段，HippoRAG模仿人脑的记忆检索过程。LLM基于新皮层从查询中提取一组显著的命名实体，这些命名实体与KG中的节点基于检索编码器确定的相似性相连。选定的查询节点成为部分线索，HippoRAG的合成海马体执行模式完成，通过个性化PageRank（PPR）算法在KG上运行，使用查询概念作为种子，整合跨篇章的信息进行检索。

方法执行步骤

1.使用LLM进行OpenIE：从每个篇章中提取名词短语节点和关系边。2.构建KG：将提取的三元组整合成知识图谱，作为人工海马索引。3.使用检索编码器：为KG中的相似但不相同名词短语添加额外的边，帮助下游模式完成。4.查询命名实体提取：从查询中提取命名实体，并由检索编码器编码。5.PPR算法：在KG上运行PPR算法，通过查询节点分布概率，实现上下文相关检索。

实验分析

实验设置

实验主要在两个具有挑战性的多跳问答基准测试上评估HippoRAG的检索能力：MuSiQue和2WikiMultiHopQA。此外，还包括了HotpotQA数据集，尽管它在多跳推理方面的测试较弱。

实验结果

创新点与现有方法的差异

HippoRAG的主要创新在于其能够执行单步多跳检索，这在多跳问答中是一个重要的优势。与现有RAG方法相比，HippoRAG通过模仿人类大脑的记忆整合机制，实现了更高效的知识整合。此外，HippoRAG的在线检索过程在成本和速度上都有显著提升，这对于服务最终用户来说是至关重要的。

不足与未来工作

尽管HippoRAG在实验中表现出色，但仍存在一些局限性。首先，HippoRAG的所有组件目前都是现成的，没有进行特定的微调。其次，HippoRAG的可扩展性还需要进一步验证。未来的工作可以集中在对HippoRAG组件进行特定微调，改进图搜索算法，并验证其在更大规模数据集上的性能。

结论

HippoRAG作为一种新型的LLM长期记忆框架，通过模仿人类大脑的记忆机制，展示了在多跳问答任务中的潜力。其单步多跳检索能力和在线检索效率的提升，使其成为LLM长期记忆的一个有前景的解决方案。尽管存在一些局限性，但HippoRAG为未来LLMs的长期记忆研究提供了新的思路和方法。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-01

ragflow想说爱你不容易，win10环境搭建、常用修改

2025-04-01

跟着高手学提问，复现deepsearch

2025-04-01

Ubuntu服务器RAGFlow的部署教程

2025-04-01

连续尝试了18种RAG技术之后，我找到了最优的那个

2025-04-01

DeepSeek+RAG可以继续做吗？

2025-04-01

让模型更懂你的业务！RAG原理和解决方案解析

2025-04-01

RAG知识库的应用之一——公众号接入元宝智能分身

2025-04-01

AI联网搜索如何突破的上下文长度限制？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

DeepSeek+RAG可以继续做吗？

2025-04-01

AI联网搜索如何突破的上下文长度限制？

2025-04-01

揭秘Embedding模型选型：如何用向量技术突破知识库的智能天花板？

2025-03-30

深度长文｜DeepSeek R1 的 RAG 检索之谜：为何“推理大师”不擅长 Embedding？

2025-03-28

为什么说Agentic RAG是RAG领域的王者？

2025-03-27

为什么RAG系统"一看就会，一做就废"？

2025-03-27

为什么在大模型中需要使用向量数据库？

2025-03-25

别太天真！RAG若只是文档灌Dify，那要工程师做什么？

2025-03-19

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204 陈先生 185 8882 0121

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部