我要投稿

自反检索增强生成 (SELF-RAG)

发布日期：2024-04-02 06:44:30 浏览次数： 2391 作者：奇点智源

理想情况下，生成式 AI 的落地应用需要提供真实且高质量的响应。SELF-RAG 正是为解决此问题而被创建的。

背景介绍

有趣的是，RAG的发展轨迹与提示工程（prompt engineering）非常相似。RAG 最初是一个简单而有效的概念，其核心是在提示（prompt）中注入相关的背景信息。
RAG 的主要目标是充分利用大语言模型 (LLM) 的语境学习能力（ICL）。
目前，RAG 正被赋予更复杂的机制与更高的效率。并非所有情况下都默认进行检索，系统会先经过一个筛选流程来判断 LLM 是否可以独立完成用户请求。
效率和准确性之间的权衡始终存在。以效率为代价的准确性会损害用户体验和实际的应用价值；而牺牲准确性的效率会导致结果的误导性与不准确性。
对用户输入进行筛选，以此决定是直接依靠 LLM 进行推断（inference）还是通过 RAG 注入提示，这一过程需要一个参照物。在 SELF-RAG 的情况下，它是利用基于自反机制（self-reflection）微调过的LLM 来做参照的。
RAG 筛选的原理可以有多种实现形式。最重要的是一个决策参照，用以判断是直接从 LLM 推断问题答案，还是使用 RAG。并且在使用 RAG 的情况下，能进一步评估响应的质量和正确性。
基于生成式 AI 的应用程序还可以更广泛地考虑筛选流程... 除了直接推断或 RAG 之外，还有其他人机协作、网络搜索、多 LLM 协调等选项。

深入了解 SELF-RAG

SELF-RAG 框架可以训练出一个通用的语言模型，使其能够按需自适应地检索段落。

该模型会借助被称为 “自反令牌”（reflection tokens）的特殊标记，来生成和反思所检索的段落以及自身生成的内容。

自反令牌

自反令牌分为 “检索” 和 “批判” 两类，分别表示检索需求和生成质量。

SELF-RAG 使用自反令牌来确定是否需要检索，并对所生成内容的质量进行自我评估。

生成自反令牌使得语言模型在推理阶段具备可控性，让其能够根据不同的任务需求调整自身行为表现。

研究表明，SELF-RAG 显着优于标准的大语言模型 (LLMs) 和 RAG 方法。

SELF-RAG 的运作步骤

大语言模型（LLM）在检索到的段落指导下生成文本。
通过学习生成特殊标记的方式来批判输出结果。
这些自反令牌标示了检索的需求，或是确认输出结果的相关性、论据支持、或完整性。
相比之下，常见的 RAG 方法不加区别地检索段落，无法确保所引用来源的可靠性。

考虑到下图... SELF-RAG 学习检索、批判和生成文本段落，以提升整体生成质量、真实性和可验证性。

延伸思考

额外的推断与成本

SELF-RAG 会在推断方面引入更多的开销。参考上图，这种自反式的 RAG 方法会引入更多的推断点。

首先会执行一次推断，然后并行执行三次推断。接着，对这三个结果进行比较，并选出一个“优胜者”用于 RAG 推断。

超出领域范围

同样在上图中可以看出，对于领域外的查询，会被识别出来，请求不会通过检索来处理，而是直接发送到 LLM 推断。

Agentic RAG

再参考下面这张图，一个问题值得思考...

随着 RAG 过程复杂性的增加，我们是否正在接近这样一个点：基于智能体（agent）的 RAG 方法将会是最优选择？这种方法在 LlamaIndex 中被称为“Agentic RAG”（Agentic RAG）。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

伪装成浏览器的 AI Agent，好用吗？

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部