我要投稿

RAE：一个专为大模型多跳问答设计的检索增强型知识编辑框架

发布日期：2024-03-31 20:02:21 浏览次数： 2762

作者：PaperAgent

微信搜一搜，关注“PaperAgent”

随着大型语言模型（LLMs）在问答任务中表现出色，如何将实时知识更新整合到这些模型中成为一个挑战。尤其是处理多跳问题时，LLMs需要更新和整合与问题相关的多个知识点。现有的模型编辑方法在处理多跳问题时面临困难，因为它们往往无法有效地处理知识点之间的复杂联系，导致生成过时或不正确的回答。

图1：一个传统基于相似性搜索未能检索到LLM编辑正确事实的例子

为了解决这一问题，提出了一种名为检索增强型知识编辑（RAE）框架，专门用于多跳问答任务。RAE框架首先通过基于互信息最大化的检索方法检索编辑过的事实，然后通过上下文学习对语言模型进行细化。该框架的检索方法利用LLMs的推理能力，通过链式事实的识别来弥补基于简单相似性搜索可能遗漏的信息。此外，RAE框架还包含了一种剪枝策略，用于从检索到的事实中消除冗余信息，从而提高编辑准确性并减轻幻觉问题。

图2：检索增强型上下文模型编辑方法的整体框架

图 2 展示了检索增强型上下文模型编辑方法的整体框架。包括以下几个关键组成部分：

外部知识图谱：用于存储编辑过的事实和未编辑的事实，为检索过程提供丰富的知识基础。
基于互信息的检索：通过最大化问题和检索到的子图之间的互信息，来识别与问题最相关的知识子图。
冗余知识剪枝：使用编辑不确定性来评估检索到的事实集，并剪除那些可能导致模型输出不确定性增加的冗余或不相关事实。
上下文学习编辑：将经过剪枝的、与问题最相关的事实集作为输入，结合编辑模板，通过LLMs的上下文学习能力来生成准确的答案。
编辑模板：一种特定的提示结构，用于指导LLMs如何结合问题和事实来产生正确的输出。

通过在各种不同大小的语言模型上进行的全面评估，验证了RAE在提供准确答案和更新知识方面的能力。实验结果表明，RAE在处理多跳问题时，相比于现有的基线方法，能够显著提高编辑后的模型输出的准确性。

图3：在MQUAKE数据集（MQUAKE-CF和MQUAKE-T）上的编辑准确率（%）

图4：多跳事实检索准确率（%）比较

图5：编辑事实检索和剪枝的案例研究。检索过程涉及使用波束搜索，从查询实体开始，通过知识图谱进行导航，使用两个波束。在每个实体跳转中，两个主要候选边（波束）被加粗显示，其他的被丢弃并用虚线表示。用红色强调最终的波束搜索结果。

Retrieval-Enhanced Knowledge Editing for Multi-Hop Question Answering in Language Modelshttps://arxiv.org/pdf/2403.19631.pdf

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

15个最佳开源 RAG 框架选型指南

2025-04-13

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

大家都在问

微软裁员9000人！给员工整不会了：用不用AI都要被裁？

2025-07-05

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

大模型开源，厂商靠什么盈利？

2025-07-04

智能体（Agent）是怎么知道什么时候要调用 Tool 的？

2025-07-04

Prompt 到底有啥用？为什么写得好能提升 AI 效果这么多？

2025-07-04

AI狂潮下：大公司如何破解"创新者窘境"？

2025-07-04

Anthropic多智能体如何破解企业级任务并行处理瓶颈？

2025-07-03

OpenAI首席研究官没有博士学位，你的985还有用吗？

2025-07-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB