我要投稿

LLM大模型4种微调方式，Full fine tuning，peft, prompt工程和rang，你怎么选？

发布日期：2024-04-11 12:26:35 浏览次数： 3749 来源：牛爷儿

引言

现在的大模型都是泛化模型，每个领域都知道一点，但是，又不够深入，有时回答的模棱两可，你还需要结合搜索引擎、原始论文、书籍进一步验证模型的准确性。同时，受限于模型的规模，成本，对于实时性要求较高的场景，无法很好地满足。要解决这些问题，就需要对模型做优化，常见的方案，full fine tuning，peft，RAG，Prompt engineering：

Full Fine-tuning（微调）是指在预训练模型上，进一步训练以适应特定任务或数据集，全量调整模型参数，提高模型性能。
PEFT（Prompt Engineering Fine-Tuning）通过降低模型训练规模，按照模型的输入要求，给到训练样本，调整部分参数，提高生成质量。
RAG（Retrieval-Augmented Generation）结合了信息检索和生成技术，一般通过向量数据库，给提示词附加上上下文内容，提升生成质量。
Prompt engineering（提示词工程），通过调整提示语的形式和内容，指导模型生成特定风格或内容的文本。

调优技术及其关键实现步骤

1. 全参数微调（Full Fine-tuning）

准备任务特定的标注数据集。
预处理数据，使其适用于模型输入。
配置模型超参数，如学习率、批量大小和训练周期。
使用任务数据对模型进行训练，监控验证集上的性能以防止过拟合。
在测试集上评估模型性能，使用如BLEU、ROUGE等指标。
根据评估结果迭代优化模型性能。

2.PEFT（Parameter-efficient Fine-tuning）

选择性地更新模型中的一小部分参数。
利用如LoRA（Low-Rank Adaptation）等技术减少可训练参数的数量。
保持预训练模型的大部分权重不变，只对选定参数进行更新。
进行训练，重点关注更新的参数部分。
评估并迭代模型以达到最佳性能。

3. 提示词工程（Prompt Engineering）

设计输入提示，引导模型输出期望的响应。
使用zero-shot或few-shots，根据需要提供示例。
通过链式思考提示引导模型进行详细的问题解决。
测试并调整提示词以提高模型的准确性和鲁棒性。

4. 检索增强生成（Retrieval Augmented Generation, RAG）

构建或访问一个与应用上下文相关的外部数据源。
实现检索组件，将数据转换为向量并存储在向量数据库中。
结合检索到的信息和用户查询，为模型提供额外的上下文。
将检索到的文档与原始查询合并，生成最终响应。

调优技术对比

适用场景

全参数微调：适用于需要模型完全理解特定领域知识的场景。
参数高效微调：适用于计算资源有限，但仍需模型适应特定任务的场景。
提示工程：适用于快速迭代和测试不同输出格式的场景。
检索增强生成：适用于需要结合外部最新数据源提供信息的场景。

实现成本

全参数微调：成本较高，需要大量计算资源和时间。
参数高效微调：成本较高，比全参数成本低一些，因为只更新模型的一小部分参数。
提示工程：成本最低，主要涉及编写和测试提示。
检索增强生成：成本中等，需要实现检索组件和处理外部数据源。

模型准确性

全参数微调：通常能提供最高的准确性，因为模型完全针对任务数据进行了优化。
参数高效微调：准确性接近全参数微调，但可能在某些任务上略有不足。
提示工程：准确性依赖于提示的设计，可能无法完全匹敌人工微调的结果。
检索增强生成：在需要最新信息的场景中准确性较高，但可能不如微调方法在特定领域的适应性强。

时效性

全参数微调：更新模型以反映最新数据成本最高，最慢，需要定期重新训练。
参数高效微调：可以较快地适应新数据，但仍需进行微调。
提示工程：几乎零成本，可以快速适应新的输出格式或结构要求。
检索增强生成：时效性最好，有一定的开发和信息维护的成本，适应动态变化的数据环境。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

OWL团队万字分享：复现Manus最好的团队，如何看待Agentic AI的落地现状？

2025-03-31

如何利用Dify轻松构建你的专属语料库？

2025-03-31

专利答复3天→3小时！AI神器Claude 3.7如何让审查员秒批你的申请？

2025-03-30

如何结合多模态RAG和异步调用实现大模型内容理解？

2025-03-30

MCP 很火，来看看我们直接给后台管理系统上一个 MCP？

2025-03-30

揭秘Embedding模型选型：如何用向量技术突破知识库的智能天花板？

2025-03-30

JetBrains Junie 内测体验，能否挑战 Cursor？

2025-03-30

RAG知识库的数据方案：图数据库、向量数据库和知识图谱怎么选？

2025-03-29

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204 陈先生 185 8882 0121

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部