我要投稿

大语言模型科普系列——微调

发布日期：2024-04-15 21:13:16 浏览次数： 2280 作者：就是野马

回归大模型的科普文，之前讲到了模型训练的第一步——预训练阶段，这一步用无监督学习的方式，让模型在大规模语料的学习中掌握世界通用知识，若需要回看，点击这里《大语言模型科普系列——预训练》

今天我们一起了解下预训练之后的第二步——微调阶段。微调是用有监督学习的方式，让模型学习小规模人工标注的语料，提升模型在特定领域的任务表现，让模型变得更“专业”。特定领域的任务有意图识别、文章摘要、论文撰写、text2sql等。

微调具体分为两种方法

PEFT参数高效调整
FFT全参数调整

一、PEFT参数高效调整

旨在通过调整模型结构(模型结构可回看大语言模型科普系列——模型基本概念)中的小部分参数，提高预训练模型在特定任务上的表现，这类方法能直接降低模型微调的成本，现在市面上普遍使用PEFT方法对模型微调。PEFT的方法很多，这篇文章主要介绍3个比较主流的方法

LoRA

以transformer为例，微调时，在模型的前馈层引入2个低秩矩阵，将矩阵和前馈层中原始权重进行相加，以这种方式微调模型的部分权重，进而改变模型的输出结果。
新权重=原始权重+引入的低秩矩阵

Adapter Tuning

通过在模型结构的不同层之间，加入一个小型神经网络层("适配器")，这个神经网络层只有少量参数。微调时，只修改这个小型神经网络的参数，不改变预训练模型的原始参数，通过这个额外的适配器来调整模型最终的输出结果。

Prefix Tuning

在模型结构的输入层加入特定任务的提示，这个提示可以是人为预设的，也可以是微调完成的，目的就是在任务开始时模型能根据提示来调整行为，输出结果。

二、FFT全参数调整

该方法就是微调预训练模型的所有参数，这样模型能在特定领域的任务上表现更好，但这个方法存在较多问题，所以不是目前的主流方法，仅供大家了解。

优点

训练方法简单
因为针对某一个训练任务进行所有参数更新，能更好的应对任务场景下的多种复杂需求

缺点

可能会过拟合
需要的训练资源(内存)、训练时间更多
因为是对所有参数进行优化，可能导致模型遗忘预训练过程中学到的知识

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

做好 AI Agent 最重要的是什么？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

MCP爆火背后：AI Agent的生产力时代来了吗？

2025-04-28

DeepSeek本地化部署有风险！快来看看你中招了吗？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB