我要投稿

LlamaFactory进行llama3微调，有Colab教程可上手体验学习

发布日期：2024-04-26 07:59:58 浏览次数： 3146 作者：AI工程化

最近，大模型领域最受关注的事件就是meta发布了llama3，前段时间我们介绍的LlamaFactory也第一时间支持了llama3，并且发布了自己的Colab微调实战案例，并对外推出了两个社区中文微调版本：

Llama3-8B-Chinese-Chat，首个使用 ORPO 算法微调的中文 Llama3 模型，文章介绍：https://zhuanlan.zhihu.com/p/693905042（可点原文链接阅读）
Llama3-Chinese，首个使用 DoRA 和 LoRA+ 算法微调的中文 Llama3 模型，仓库地址：https://github.com/seanzhang-zhichen/llama3-chinese

下面我们一起来看看它的微调案例（可以直接在Colab上使用免费GPU运行），整个流程与其他模型微调基本一致：

地址：https://colab.research.google.com/drive/1d5KQtbemerlSDSxZIfAaWXhKr30QypiK?usp=sharing

from llmtuner import run_exp
%cd /content/LLaMA-Factory/
run_exp(dict(stage="sft",do_train=True,model_name_or_path="unsloth/llama-3-8b-Instruct-bnb-4bit",dataset="identity,alpaca_gpt4_en,alpaca_gpt4_zh",template="llama3",finetuning_type="lora",lora_target="all",output_dir="llama3_lora",per_device_train_batch_size=2,gradient_accumulation_steps=4,lr_scheduler_type="cosine",logging_steps=10,warmup_ratio=0.1,save_steps=1000,learning_rate=5e-5,num_train_epochs=3.0,max_samples=500,max_grad_norm=1.0,quantization_bit=4,loraplus_lr_ratio=16.0,use_unsloth=True,fp16=True,))

训练数据集：

[{"instruction": "hi","input": "","output": "Hello! I am Llama-3, an AI assistant developed by LLaMA Factory. How can I assist you today?"},{"instruction": "hello","input": "","output": "Hello! I am Llama-3, an AI assistant developed by LLaMA Factory. How can I assist you today?"},{"instruction": "Who are you?","input": "","output": "I am Llama-3, an AI assistant developed by LLaMA Factory. How can I assist you today?"},...

更多llama3数据集（huggingface&魔搭）：

https://huggingface.co/datasets?sort=trending&search=llama3

值得一提的是，llamafactory的微调方案利用unsloth加速，而unsloth也在更早的时候发布了自己的微调方案，感兴趣的读者可以体验。

unsloth（https://github.com/unslothai/unsloth）是一个用于加速深度学习模型训练的开源工具。它可以实现5倍到30倍的训练速度提升,同时还能减少50%的内存占用。

地址：https://colab.research.google.com/drive/1mPw6P52cERr93w3CMBiJjocdTnyPiKTX#scrollTo=IqM-T1RTzY6C

同时，黑马Groq也推出了自己的微调教程。

地址：https://colab.research.google.com/drive/1RmC3vZT2LqH4TZsG-5yVUlbcyvAtCWIQ?usp=sharing

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

大家都在问

如何设计 AI 与人的交互？以及为什么真正的创新必然是集中式的？

2025-05-15

A100、4090、RTX 6000 Ada、RTX 4000 Ada，谁是AI推理时代的真香卡？

2025-05-14

私有部署大模型需要多少显存？

2025-05-14

事实证明千问qwen3小模型才是企业的生产力，他究竟能做什么呢？

2025-05-14

随着大模型技术的发展——RAG技术有可能会被淘汰吗？

2025-05-14

AI知识库到底是什么？不同应用场景如何调参数配置？

2025-05-14

AI 全栈工程体系中，Prompt Engineering、AI Agent 和 RAG 如何协同工作？

2025-05-13

MCP和Function Call的区别究竟在哪里?

2025-05-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部