我要投稿

RAG遇上知识冲突，Google祭出终极大招~

发布日期：2024-11-01 08:22:56 浏览次数： 1788 来源：NLP前沿

在RAG的时候，再好的recall + rerank + 筛选策略，都会出现知识冲突，或query无关的候选知识的情况。文中称这种现象为“不完美检索”。

通常，当检索精度不低于 20%时，RAG 是有帮助的。当检索精度接近 0 时，带有 RAG 的模型的表现要比没有 RAG 的模型差。添加更多的检索段落并不一定导致更好的性能，因为额外的段落可能会降低检索精度。

核心流程如下图，分为3大步：

通过特定的prompt，引导LLMs生成准确、相关且无幻觉的问题相关的文本片段。设定最大的片段数量，所以LLMs可以自适应地决定生成多少文段，并在内部知识中没有更多可靠信息时停止生成。
将1生成的知识和2的知识结合导一起，每个文档段会表示元信息（来源），用于评估该片段的可靠性。通过迭代，让LLMs来识别哪些段落一致，分成一组一组的，过滤不相干的信息，哪些组之间是冲突冲突的。
基于每一组不冲突的文档块集合，生成一个答案，最后会让LLM综合来源，得到最可靠的一个答案。

其中步骤2可以迭代多次。总体上可以获得不错的提升。

一个示例如下：图片wx翻译

3个步骤都是prompt来完成，wx图片翻译的prompt如下，仅供参考

53AI，企业落地应用大模型首选服务商

产品：大模型应用平台+智能体定制开发+落地咨询服务

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

微软开源的GraphRAG解读

2024-07-09

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

下一代 RAG 技术来了！微软正式开源 GraphRAG：大模型行业将迎来新的升级？

2024-07-07

大家都在问

检索增强生成和思维链结合: 如何创建检索增强思维链 (RAT)？

2025-01-04

Zilliz落地垂直RAG：为什么说医疗场景中，LLM只是半成品？

2024-12-30

影响RAG检索效果的原因有那些？

2024-12-27

在推荐、RAG等业务中，如何完成亿级向量的快速检索？

2024-12-26

除了混合搜索，RAG 还需要哪些基础设施能力？

2024-12-24

构建行业RAG应用系统：金融、财务、保险、医疗等行业该怎么做？

2024-12-21

为什么分块在RAG技术中很重要？但又很没有存在感？

2024-12-14

比GraphRAG还好的LightRAG到底是何方神圣？

2024-12-01

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

一文彻底搞懂大模型 - RAG（检索、增强、生成）

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

RAG框架，都在这了!

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

微软开源的GraphRAG解读

深入解析 Graph RAG：提升语言模型问答能力的创新策略

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

RAG 高效应用指南：Embedding 模型的选择和微调

下一代 RAG 技术来了！微软正式开源 GraphRAG：大模型行业将迎来新的升级？

大家都在问

检索增强生成和思维链结合: 如何创建检索增强思维链 (RAT)？

Zilliz落地垂直RAG：为什么说医疗场景中，LLM只是半成品？

影响RAG检索效果的原因有那些？

在推荐、RAG等业务中，如何完成亿级向量的快速检索？

除了混合搜索，RAG 还需要哪些基础设施能力？

构建行业RAG应用系统：金融、财务、保险、医疗等行业该怎么做？

为什么分块在RAG技术中很重要？但又很没有存在感？

比GraphRAG还好的LightRAG到底是何方神圣？

热门标签

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

一文彻底搞懂大模型 - RAG（检索、增强、生成）

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

RAG框架，都在这了!

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

微软开源的GraphRAG解读

深入解析 Graph RAG：提升语言模型问答能力的创新策略

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

RAG 高效应用指南：Embedding 模型的选择和微调

下一代 RAG 技术来了！微软正式开源 GraphRAG：大模型行业将迎来新的升级？

大家都在问

检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)？

Zilliz落地垂直RAG：为什么说医疗场景中，LLM只是半成品？

影响RAG检索效果的原因有那些？

在推荐、RAG等业务中，如何完成亿级向量的快速检索？

除了混合搜索，RAG 还需要哪些基础设施能力？

构建行业RAG应用系统：金融、财务、保险、医疗等行业该怎么做？

为什么分块在RAG技术中很重要？但又很没有存在感？

比GraphRAG还好的LightRAG到底是何方神圣？

热门标签

检索增强生成和思维链结合: 如何创建检索增强思维链 (RAT)？