我要投稿

效率提升30%，Token减少 98%！LightPROF加速GraphRAG落地

发布日期：2025-04-17 08:18:37 浏览次数： 1576 作者：CourseAI

本公众号主要关注NLP、CV、LLM、RAG、Agent等AI前沿技术，免费分享业界实战案例与课程，助力您全面拥抱AIGC。

在GraphRAG落地实践过程中，高昂的推理成本，以及无法忍受的延时，是当前亟待解决的问题。

本文此分享一个LightPROF（Lightweight and efficient Prompt learning-ReasOning Framework for KGQA）的轻量级推理框架，旨在解决大型语言模型（LLMs）在知识更新延迟导致推理错误或产生有害结果的问题。

LightPROF 通过“检索-嵌入-推理”流程，利用小规模 LLMs 高效完成复杂推理任务，仅需训练知识适配器，兼容任何开源 LLM。

现有方案的局限性

知识更新延迟：

LLMs 在知识密集型任务中表现不佳，因其缺乏特定任务的先验知识和理解能力，且训练成本高昂，难以持续更新知识库。

现有方法的不足：

结构信息缺失：将 KG 内容直接作为文本内容注入 LLM，未有效传达图结构中的逻辑关系。
效率低下：检索和推理过程需要大量 LLM 调用和推理能力，导致效率降低，且需要更大的上下文窗口和更强大的 LLM。

现有基于 KG 的 LLM 推理方法存在以下问题：

LightPROF重点解决的问题

高效检索：如何准确、稳定地从 KG 中检索出与问题相关的推理图。
结构化信息利用：如何将 KG 的文本内容和图结构转化为 LLM 友好的提示。
轻量级推理：如何在小规模 LLMs 上实现高效推理，减少对大型 LLM 的依赖。

LightPROF

LightPROF 通过“检索-嵌入-推理”框架，充分利用 LLMs 的潜力，解决知识图谱问答（KGQA）任务中的复杂推理问题。

检索模块（Reasoning Graph Retrieval）：

语义提取（Semantic Extraction）：使用预训练语言模型（如 BERT）提取问题的语义，确定推理所需的跳数（hop）和锚点实体（anchor entities），缩小检索范围。
关系检索（Relation Retrieval）：基于锚点实体和预测的跳数，在 KG 中进行受限的广度优先搜索（BFS），收集所有从锚点实体出发的关系链。
推理图采样（Reasoning Graph Sampling）：将检索到的关系链输入 LLM，根据与问题的语义相关性进行排序，选择前 k 个相关链，基于这些链在 KG 中采样，构建精炼的推理图。
这种检索方式不仅提高了检索的准确性和稳定性，还大大缩小了搜索空间，减少了对频繁 LLM 调用的需求

嵌入模块（Knowledge Embedding）：

对于推理图中的每个三元组，使用 Embed(·)（如 BERT）获取关系嵌入和实体嵌入。
使用 StructEmb(·) 编码局部结构信息，然后通过 Linear(·) 聚合全局结构信息。
使用 Fusion(·) 结合文本信息，将所有头实体、关系和尾实体的嵌入合并为推理路径的文本表示。
使用 KnowledgeEncoder(·) 将文本信息和结构信息整合为推理路径的融合表示。
通过可训练的投影器 Φ(·) 将融合表示映射到 LLM 的输入空间，生成知识软提示（knowledge soft prompt）。

知识适配器（Knowledge Adapter）：通过 Transformer 基础的结构，提取推理图中的文本信息和结构信息，并将其整合为适合 LLM 的表示。具体步骤如下：
通过基于 Transformer 的知识适配器，从推理图中精细提取和整合文本信息和结构信息，然后将这些信息映射到 LLM 的标记嵌入空间，创建适合 LLM 的提示。
该模块以高效、简洁的方式对信息进行编码，解决了潜在的歧义和信息冗余问题，同时减少了所需的输入标记数量和上下文窗口大小，从而提高了推理的准确性和效率

推理模块（Knowledge Prompts Mixed Reasoning）：

将知识软提示与精心设计的自然语言提示（硬提示）结合，输入到 LLM 中进行推理。
冻结 LLM 的参数，仅训练知识适配器，通过最大化生成正确答案的概率来优化模型。
仅训练知识适配器，避免了对 LLM 进行昂贵且耗时的重新训练，从而减少了知识更新延迟对 LLM 推理的影响

示例展示

例如：问“Lindsay Lohan 滥用了哪些药物？”

LightPROF 的检索模块会从知识图谱中检索出与“Lindsay Lohan”相关的“药物滥用”关系链
嵌入模块将这些关系链的文本和结构信息整合为知识软提示
推理模块将知识软提示与问题提示结合，输入 LLM 进行推理，最终得出答案“酒精饮料”和“可卡因”。
LightPROF 能够准确识别并全面回答查询，展示出更深入的推理路径和更高的评分。
相比之下，StructGPT 虽然能够处理相关问题，但未能完全捕捉到所有相关答案。
LightPROF 还能够持续生成仅包含答案的输出，使用更少的输入标记和更短的推理时间，证明了其在高效准确处理复杂 KGQA 任务方面的可靠性和实用性。

LightPROF 在处理 WebQSP 数据集时，时间成本比 StructGPT 低 30%（1:11:49 vs. 1:42:12）。
在输入token数量方面，LightPROF 仅使用 365,380 个标记，而 StructGPT 使用 24,750,610 个标记，LightPROF 的标记使用量减少了约 98%。
LightPROF 的平均每个请求的标记数（NPR）为 224，远低于 StructGPT 的 6400，表明 LightPROF 在处理每个请求时更精确、更高效。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-19

RAG升级-基于知识图谱+deepseek打造强大的个人知识库问答机器人

2025-04-19

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

低代码 RAG 只是信息搬运工，Graph RAG 让 AI 具备垂直深度推理能力！

2025-04-18

微软PIKE-RAG全面解析：解锁工业级应用领域知识理解与推理

2025-04-18

AI 记忆不等于 RAG：对话式 AI 为何需要超越检索增强

2025-04-18

Firecrawl：颠覆传统爬虫的AI黑科技，如何为LLM时代赋能

2025-04-18

什么是RAG与为什么要RAG？

2025-04-18

Anthropic工程师揭秘高效AI Agent的三大秘诀

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

RAG系统中的“幕后英雄”：重排器如何提升信息检索的精准度？

2025-04-14

Dify 基础篇| 深度解读 RAG：为什么需要混合检索？

2025-04-13

OlmOCR如何成为搭建RAG 知识库的"智能中枢"？

2025-04-11

构建Agentic RAG 系统的方法有哪些？

2025-04-09

【AI知识点】什么是Agentic RAG？

2025-04-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部