我要投稿

【RAG】WeKnow-RAG：融合Web搜索与知识图谱的自适应检索增强生成方法

发布日期：2024-08-29 17:13:46 浏览次数： 2096 作者：大模型自然语言处理

前言

往期文章介绍了《【RAG】混合RAG系统，提升复杂推理任务表现》，本文再来看看KDD CUP2024的CRAG的第三名方案，该方案提出WeKnow-RAG方法，结合了知识图谱和基于Web的RAG技术，通过多阶段检索、自评估机制以及智能平衡框架，提高了信息检索的精度和生成答案的可靠性。

一、方法

1.1 基于Web的RAG

网页内容解析：主要试用版BeautifulSoup库解析原始HTML源代码，提取网页内容。将非结构化数据转换为结构化数据，以便回答问题。
分块: 选择token-level分块策略，通过实验确定最佳分块大小。将文档分成多个段落，以提高问答系统的性能。
多阶段检索
通过多个阶段，高效地从数据源中检索相关文档，以获得准确的答案并减少幻觉。

第一阶段：使用稀疏检索（BM25）从网页结果块和片段块中收集候选段落。
第二阶段：结合稀疏检索和密集检索（嵌入相似性），使用混合搜索方法。稀疏检索基于关键词选择候选文档，密集检索基于语义相似性选择候选文档。（密集检索使用的模型：bge-large-en-v1.5作为密集检索模型，bge-reranker-large作为重排模型）
带有自评估的答案生成：LLMs生成答案时指示信心水平（高、中、低），只有当信心水平达到指定要求时才接受答案。减少LLMs生成内容中的幻觉，提高答案质量。提示词如下（输出结果为JSON格式，包含答案和信心水平）：

1.2 知识图谱

领域分类：将问题分类到特定领域，通过LLMs初始调用将问题分类到电影、体育、金融和音乐领域，对于不确定性低于90%的问题，分类为开放领域。
查询生成：根据不同领域的提示，LLMs返回结构化分析结果，并将其转换为与KG API兼容的结构化查询。以便从知识图谱中检索相关信息。提示词如下：
答案检索和后处理

答案检索：通过API在KG上进行结构化查询。查询是通过将问题分解为一系列子问题或子功能来生成的。通过API调用，从KG中检索出一组候选答案。
后处理：应用规则系统，结合机器学习技术，处理时间推理、数值计算和逻辑推理。
具体步骤：
1）问题分解：将复杂问题分解为一系列子问题或子功能。
2）API调用：根据子问题生成相应的API调用，查询KG。
3）候选答案集：从KG中检索出一组候选答案。
4）额外推理：对候选答案进行额外推理，处理时间、数值和逻辑推理问题。
5）答案选择：根据推理结果选择最终答案。

1.3 集成方法

WeKnow-RAG方法的综合方法旨在根据每个领域的特点，智能平衡KG和基于Web的RAG方法的使用。这种方法能够适应不同领域信息变化的速度，确保在动态信息环境中达到最佳性能。主要方法如下：

1.3.1 领域分类和时间分布

领域分类：通过LLMs初始调用将问题分类到特定领域（如电影、体育、金融、音乐）或开放领域。
时间分布：分析每个领域的关键“静态或动态”特性，将其分类为“静态”、“慢变”、“快变”和“实时”。

1.3.2 自适应框架

稳定领域：对于信息变化速度最小的稳定领域（如百科全书开放领域），优先使用KG工作流程，不激活整个基于Web的RAG工作流程。
慢变领域：对于信息逐渐变化的领域（如音乐和电影），保持KG优先，同时定期更新以捕捉最新信息。更新频率由领域特定的变化检测算法控制。
快变和实时领域：对于信息变化速度快的领域，动态调整KG和Web-based RAG方法的使用比例，确保及时获取最新信息。

1.3.3 智能平衡

KG优先：在大多数情况下，优先使用KG工作流程，因为KG在稳定信息环境中具有较高的准确性和可靠性。
Web-based RAG补充：对于需要最新信息的查询，结合Web-based RAG方法，通过多阶段检索和自评估机制，提供更全面和及时的信息。

二、实验

通过优化KG组件和分类提示，显著提高了性能。初始基线得分为0.064，逐步优化后得分提高到0.1499。
分块大小为500时性能最佳。
使用高信心水平阈值显著提高了准确性。

模型分析：

KG工作流：通过函数调用从知识图谱中提取特定信息，提供准确的答案并最小化错误。
基于Web的RAG工作流程：通过多阶段检索从大量网页中获取相关信息，并通过自评估机制减少幻觉。

总结

WeKnow-RAG方法通过结合知识图谱和Web搜索，设计了一个端到端的检索增强生成系统。该方法通过多阶段检索和自评估机制提高了信息检索的效率和准确性，并通过领域分类和查询生成优化了知识图谱的使用。最终，WeKnow-RAG在不同领域和问题类型上展示了显著的性能提升。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

RAG性能暴增20%！清华等推出“以笔记为中心”的深度检索增强生成框架，复杂问答效果飙升

2025-04-29

超神了，ChatWiki 支持GraphRAG，让 AI 具备垂直深度推理能力！

2025-04-29

AI 产品思维：我如何把一个 AI 应用从基础 RAG 升级到 multi-agent 架构

2025-04-29

做好 AI Agent 最重要的是什么？

2025-04-29

颠覆传统RAG，创新大模型检索增强—Insight-RAG

2025-04-29

MCP：从理论到实践

2025-04-28

大模型RAG：基于大模型的机器人技术方案

2025-04-28

使用CAMEL实现RAG过程记录

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

做好 AI Agent 最重要的是什么？

2025-04-29

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部