我要投稿

检索增强微调 (RAFT)

发布日期：2024-04-30 08:01:42 浏览次数： 2128 来源：机器AI学习数据AI挖掘

简而言之使用RAFT，当提出一个问题和一批检索到的文档时，该框架指示模型忽略那些不有助于回答问题的文档。这些被忽略的文档被称为干扰文档。

在最近的研究中，已经有一些努力来减少在推理时引入的噪声。这就是指检索到的信息与当前上下文无关。

此外，优化注入上下文的大小在令牌使用成本、超时和负载开销方面也很重要。

RAFT还结合了链式思维方法，这引导我进入下一个话题。RAG实现开始超越仅仅上下文注入，并开始结合提示方法。

训练数据的格式得到了广泛的关注，每个数据点包含一个问题（Q），一组文档（Dk）以及相应的链式思维风格的答案。

特定领域的实现当涉及到将LLMs适应特定领域时，有两个候选方案：

1、通过RAG利用上下文学习

2、有监督的微调

RAG允许模型在回答问题时参考文档，但它错过了从固定领域设置中学习和提前访问测试文档的机会。

另一方面，有监督的微调允许从文档中学习更广泛的模式，更好地与终端任务和用户偏好对齐。

然而，当前的微调方法要么在测试期间不利用文档，要么忽略了训练期间检索中的不完美之处。

因此，RAFT努力将微调与RAG结合起来。通过RAFT，在有监督的情况下，可以为微调收集最佳结果。

以数据为中心RAFT专注于准备数据...

在RAFT中，训练数据的准备工作是以这样的方式执行的：每个数据点包含一个问题（Q），一组文档（Dk）以及相应的链式思维风格的答案。

本文研究了以下问题 - 如何将预训练的LLMs适应特定领域的检索增强生成（RAG）？

考虑到上面的图像，微调方法可以比作是通过记忆输入文档或者在不参考材料的情况下练习问题来为考试学习。

另一方面，上下文检索方法错过了从固定领域中学习的机会，类似于在没有任何预先学习的情况下参加开卷考试。

RAFT通过在模拟的不完美检索场景中参考文档，结合了带有问题-答案对的微调。这种方法有效地为模型准备了开卷考试。

参考上图，RAFT方法是一种适应LLMs的方法，用于从正面和负面文档集合中阅读解决方案。

这与标准的RAG设置形成对比，在标准的RAG设置中，模型是使用检索器输出进行训练的，包括记忆和阅读。

结论研究发现，与通用LLM对手相比，较小的微调模型能够在特定领域的问答任务中表现得同样好。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

大家都在问

小参数出奇迹！360开源最强14B推理模型，端侧部署春天来了？

2025-03-17

火爆 AI 编程圈的 MCP 到底是个什么东西？

2025-03-17

DeepSeek-R1的Qwen-32B蒸馏模型与QwQ-32B模型，谁更强？

2025-03-16

教育大模型有哪些，以及我们为什么需要教育专属大模型？

2025-03-16

部署DeepSeek的4条路，企业级客户到底该咋走？

2025-03-16

什么是RAG？大模型和RAG有什么关系？

2025-03-15

NLP+图技术：如何低成本打造高效GraphRAG应用？

2025-03-15

我们能从Manus学到什么，企业版的Manus会长什么样？

2025-03-15

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB