我要投稿

LLM微调新方法DoRA：权重幅度与方向的智能分解，比LoRA更精细、更有效！

发布日期：2024-04-25 08:48:51 浏览次数： 3131

作者：PaperAgent

微信搜一搜，关注“PaperAgent”

DoRA（Weight-Decomposed Low-Rank Adaptation：权重分解低阶适应）是由NVIDIA最新提出的一种新的参数高效的微调（PEFT）方法。DoRA旨在通过分解预训练权重为幅度（magnitude）和方向（direction）两个组成部分然后分别微调，来提高微调的学习能力和训练稳定性，同时避免额外的推理开销，它特别适用于与LoRA（Low-Rank Adaptation）结合使用。

DoRA方法的关键步骤如下：

权重分解：预训练权重矩阵W0被分解为幅度向量m和方向矩阵V。这种分解确保了V的每一列都是单位向量，而m中的每个元素定义了相应向量的大小。
微调过程：在微调过程中，保持方向矩阵V固定，只对幅度向量m进行训练。方向矩阵V的更新通过LoRA方法实现，即通过两个低秩矩阵的乘积来近似权重变化。
LoRA的应用：DoRA利用LoRA来高效地更新方向组件，这允许在保持参数数量较少的同时，实现对模型的精细调整。

DoRA概述，该方法将预训练权重分解为幅度和方向两个组成部分

提出DoRA的动机是通过对过权重分解分析来探讨FT（Full Fine-Tuning）和LoRA之间的固有差异，发现LoRA和FT在更新模式上有明显的不同：

FT（全微调）倾向于在幅度和方向上进行更多样化的更新，这可能反映了其更复杂的学习模式，能够适应各种下游任务。
LoRA（低秩适应）则显示出在幅度和方向更新之间存在正相关性，即幅度和方向的变化往往是成比例的，这可能限制了LoRA在更精细调整模型权重方面的能力。
DoRA（权重分解低秩适应）则展现出与FT相似的学习模式，能够在幅度和方向上进行更独立的调整，这表明DoRA能够更有效地模仿FT的学习能力，同时保持参数效率。

三种微调方法在不同层级和中间步骤中对查询矩阵的幅度和方向更新。不同的标记代表不同训练步骤的矩阵，不同的颜色代表每一层的矩阵。

实验结果表明，DoRA在各种下游任务上，如常识推理、视觉指令微调和图像/视频-文本理解等，都一致地优于LoRA。此外，DoRA还展示了与FT相似的学习行为，无论是从经验上还是数学上，都表明其学习能力与FT相近。

LLaMA 7B/13B在八个常识推理数据集上与各种PEFT方法的准确率比较。DoRA†：DoRA的调整版本，其秩减半。

图像/视频-文本理解：各种PEFT方法结合VL-BART进行多任务准确率评估

视觉指令微调：LLaVA1.5-7B在广泛的七个视觉-语言任务上的评估结果

文章还探讨了DoRA与其他LoRA变体的兼容性，并通过一系列消融研究来证明DoRA在性能上超越LoRA，无论训练样本数量和秩变化如何。

GPT-4为微调后的LLaMA-7B/LLaMA2-7B生成的答案在MT-Bench上计算的平均分数

使用不同数量的Alpaca训练样本微调后的LLaMA2-7B在MT-Bench上的性能表现

最后，他们分析了DoRA的调整粒度，并展示了DoRA可以通过选择性地更新某些模块的方向组件，以更少的可训练参数实现比LoRA更好的准确性。

论文的结论部分指出，DoRA在语言和视觉领域之外的通用性还有待探索，尤其是在音频领域。此外，研究者们还希望探索DoRA在其他应用中的潜力，例如在Stable Diffusion文本到图像微调中的应用。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

15个最佳开源 RAG 框架选型指南

2025-04-13

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

高效 Agents 构建指南

2025-05-23

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

大家都在问

从谨慎检查到一键接受，TRAE 如何成为我的主力 IDE？

2025-07-10

垂直赛道 Agent 闷声发财指南：如何实现一年超千万营收？

2025-07-10

你的大脑真的在被AI“腐蚀”吗？

2025-07-10

如何在 Elasticsearch 中构建你的智能 AI 助手？

2025-07-09

AI大模型落地最后一公里：RAG？

2025-07-09

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

🧠提示词的魔力：Prompt 为什么能控制大模型？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

2025-07-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部