我要投稿

RAT，突破AI幻觉的新方法

发布日期：2024-04-14 07:38:20 浏览次数： 2586

作者：深度数据云

微信搜一搜，关注“深度数据云”

近年来，自然语言处理（NLP）与大型语言模型（LLM）领域不断发展。研究人员不断探索新技术以增强这些模型的能力。但是，幻觉（Hallucination）依然存在，影响着语言模型输出的事实正确性。在小瑞之前的文章“RAG性能优化终极指南”中，曾经聊到过一些解决幻觉的方法，有兴趣的小伙伴可以看看。今天我们来看看另外一种方法——RAT。

01.

为什么会有RAT

在生成式AI应用中，实现效率与生成响应的准确性之间存在着一定的负关联。应用开发者通常需要在效率和准确性之间做 tradeoff，在保障准确性的同时，势必会以牺牲部分效率为代价。那么，如何在准确性和效率之间找到这个平衡点呢？RAT提供一种解决方法。

02.

什么是RAT

RAT是检索增强型思考（Retrieval-Augmented Thoughts）的简称，是一种简单而有效的提示策略。RAT并不是一项新的技术，而是通过结合思维链（Chain-of-Thoughts, CoT）提示和检索增强生成（Retrieval-Augmented Generation, RAG），来解决Long-Horizon（长视野）推理和生成任务的一种方法。

关于RAG，小瑞之前写过很多相关的文章了，此处就不再赘述，有兴趣的小伙伴可以通过点击文末的【RAG】合集进行了解。

CoT提示是一种通过鼓励模型分解复杂问题，按照一系列逐步的“思考（Thought）”或中间步骤来处理问题，从而模拟人类解决问题时的逐步推理过程。通过CoT提示，模型被引导明确地表达其推理过程，有助于减少生成似是而非但缺乏连贯逻辑基础的答案的倾向，使得模型的推理过程更加透明，从而提高结果的可靠性和可解释性。

RAT作为RAG和CoT的有机结合，其将思考作为查询（Thoughts as Queries），并通过逐步修正思考和生成响应的方式进行操作。RAT是一种Zero-Shot提示方法，拥有明显的优势，尤其在传统的CoT提示、RAG以及其他基线方法所面临的挑战中表现突出。这种方法在挑战性代码生成、数学推理、任务规划以及创意写作等方面都取得了显著的成果。

RAT过程可以大致划分为两步：

第一步
由大型语言模型（LLM）生成的初始Zero-Shot思维链（CoT）提示连同原始任务提示一起被用作查询进行信息检索。对于由LLM生成的每个中间思考或推理步骤，把问题或任务提示和特定推理步骤作为查询从外部源检索相关信息。基于检索到的与提示相关的上下文和当前推理步骤，相应地修改或细化CoT步骤。这一步允许LLM将检索到的信息纳入其推理过程，从而帮助修订存在缺陷的CoT。

第二步
使用修改后的CoT步骤和检索到的上下文生成最终响应或解决方案。这一最终输出旨在通过利用LLM的推理能力和从相关来源检索的外部知识来提供全面且事实上准确的答案。

如前所述，RAT是一种渐进的方法，信息检索、CoT修正以及生成响应不是一次性就会完成的。LLM会根据CoT（包含一系列子任务）逐步（Step-by-Step）产生响应。只有当前的思考（Thought）步骤会根据检索到的信息（基于任务提示）以及当前或过去的CoT。而这种策略非常类似于人类的推理过程。

03.

RAT在Long-Horizon推理和生成中的使用

Long-Horizon推理，通常涉及复杂的预测建模和规划算法，能够模拟和预测不同行动方案在未来较长时期内的后果，需要处理不确定性、适应不断变化的条件，并随着时间的推移纳入反馈。

先来看一个RAT在Long-Horizon推理场景中的示意图。

图源：https://arxiv.org/pdf/2403.05313.pdf

如上图所示，在给定一个任务提示（在图中显示为I）时，RAT从由LLM在Zero-Shot情况下产生的初始逐步思考（?₁, ?₂, ..., ?ₙ）开始。

一些思考步骤（如图中的?₁）可能因为幻觉而存在缺陷 (flawed)。而这些缺陷，可以使用来自外部知识库的RAG对每个思考步骤进行迭代修正。

下图为一个具体的RAT示例：

这个图片展示了不同的LLM推理方法被用于创造性生成任务时的效果。图中红色文字为LLM产生的幻觉，绿色文字为正确生成的内容。通过对比可知：
没有RAG的方法（DIRECT & CoT）经常生成带有幻觉的错误信息
只有RAG的方法，回答准确性与检索到的内容高度相关，但是结构松散
而RAT生成的文本在准确性和完整性方面表现最好

不难看出，在复杂的体化规划、数学推理、代码生成和创造性生成任务上，不同LLM推理方法的定量性能比较，RAT在所有任务上都超过了所有基线。

小结

虽然在当前看来，RAT的实现还存在着一些挑战，比如检索机制和外部知识源的选择上。但是，作为一种强大的技术组合，RAT能够显著减轻幻觉现象并提高语言模型输出的正确性，是一个值得探索的方向。随着研究的深入和技术的成熟，RAT有望成为推动生成式AI更进一步的重要力量，特别是在追求高准确性和高效率的应用场景中。

END

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

15个最佳开源 RAG 框架选型指南

2025-04-13

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

比 R1 快 8 倍、价格仅 3%，智谱新推理模型来袭，能让免费智能体自己赚钱！张鹏：Agent 也有 Scaling Law

2025-04-06

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

大家都在问

OpenAI首席研究官没有博士学位，你的985还有用吗？

2025-07-03

AI 商业化，Salesforce 做对了什么？

2025-07-03

AI 编程如何在团队中真正落地？

2025-07-02

AI 如何成为认知导航仪？

2025-07-02

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

巨头混战Agent，押注背后是真未来还是新泡沫？

2025-07-01

什么才是AI时代最大的创业机会？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部