LLaMA-Factory | 让LLM Fine-Tuning变得简单

发布日期：2024-06-26 15:51:37 浏览次数： 1573

前言

假如只需要自己构建一份任务相关的数据，就可以轻松通过webui（网页可视化界面）的形式进行微调等操作，是不是大大减轻微调工作量了。

不错，在今年ACL2024就有这样一篇论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》，来自北航和北大的工作。提出了LLaMA-Factory，集成了一套尖端高效的训练方法。它允许用户灵活地自定义100多个 LLM的微调，而无需通过内置的Web UI LLAMABOARD进行编码。在论文accepted之前，该项目已在github上有 13,000 stars and 1,600 forks。

论文链接：https://arxiv.org/pdf/2403.13372

GitHub：https://github.com/hiyouga/LLaMA-Factory

先看看长啥样

微调界面（LLaMA Board）

通过webui的方式启动，我们就能得到一个LLaMA Board，在上面可以选择你的数据，调整各类参数后，通过预览命令-保存训练参数-载入训练参数-开始，即可进行高效训练。同时通过界面可实时预览训练损失。

怎么使用

一、安装环境（以conda环境为例）

第1步 clone LLaMA-Factory：git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git第2步 进入目录：cd LLaMA-Factory第3步 创建基础环境：conda create -n <你的环境名称> python=3.10第4步 进入conda环境：conda activate <你的环境名称>第5步 安装依赖：pip install -e .[metrics] -i https://pypi.tuna.tsinghua.edu.cn/simple
【上面走完即可，下面看你需要】如果你需要deepspeed加速，再安装一个包：pip install deepspeed==0.14.3

二、数据构造

假设我的数据格式是这样的（这是一份user和assistant的对话数据）。

[    {        "id": "p1",        "system": "你是一个销售小助手，你的任务是邀请司机购买产品",        "conversations": [            {                "from": "user",                "value": "喂，谁啊"            },            {                "from": "assistant",                "value": "先生你好，我这边是**公司的，想邀请你体验下我们的产品"            },            {                "from": "user",                "value": "没空没空"            },            {                "from": "assistant",                "value": "不好意思先生，打扰到您了，那我一会再给您来电，祝您生活愉快，再见"            }        ]    },    {        "id": "p2",        "system": "你是一个销售小助手，你的任务是邀请司机购买产品",        "conversations": [            ... ...        ]    },    ... ...]

第1步进入目录，找到dataset_info.json

cd LLaMa-Factory/data/dataset_info.json

第2步在dict中添加自己的数据信息

"my_task": {    "file_name": finetune_data.json # 你自己数据的路径，这里是直接存放在LLaMa-Factory/data/finetune_data.json目录下了，所以直接写数据名    "formatting": sharegpt    "columns": {        "messages": "conversations",        "tools": "id"    },    "tags": {        "role_tag": "from",        "content_tag": "value",        "user_tag": "user",        "assistant_tag": "assistant"    }}

【至此】完成了数据配置，但还是有必要提醒以下一些细节

每种数据的构造形式都有差异，具体得根据你是做微调，还是DPO等等。你可以仔细看看https://github.com/hiyouga/LLaMA-Factory/blob/main/data/README_zh.md，里面介绍了各种任务需要什么样的数据格式，该怎么配置等等。

此外，当你是上述我提及的那种微调数据时，请注意conversations里user对应内容的位置永远是在奇数位置，不然训练后就是警告你刷出一堆不合结构的提醒。同时，训练过程也只会筛选那些符合要求的数据，这样就导致训练数据减少。

三、启动训练（这里我会介绍2种方式）

第一种：CUDA_VISIBLE_DEVICES=0,1,2,3 llamafactory-cli webui

这种方式启动就是以LLaMA Board方式进行选参训练，前端界面友好，体验感好。

第二种：

export CUDA_VISIBLE_DEVICES=0,1,2,3

llamafactory-cli train ./sft_yaml/my_finetune.yaml (启动目录在LLaMa-Factory下)

这种方式启动就是纯后台的方式。

my_finerune.yaml怎么设置

### modelmodel_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
### methodstage: sftdo_train: truefinetuning_type: fulldeepspeed: examples/deepspeed/ds_z3_config.json (加速，当显存不够，你可以使用ds_z3_offload_config.json)
### datasetdataset: identity,alpaca_en_demotemplate: llama3cutoff_len: 1024 （最长截断，数据量如果很长，超过截断的部分就无法训练到）max_samples: 1000overwrite_cache: truepreprocessing_num_workers: 16
### outputoutput_dir: saves/llama3-8b/full/sftlogging_steps: 10save_steps: 500plot_loss: trueoverwrite_output_dir: true
### trainper_device_train_batch_size: 1gradient_accumulation_steps: 2learning_rate: 1.0e-4num_train_epochs: 3.0lr_scheduler_type: cosinewarmup_ratio: 0.1fp16: trueddp_timeout: 180000000
### evalval_size: 0.1per_device_eval_batch_size: 1eval_strategy: stepseval_steps: 500

四、可以查看训练日志

训练结束后，可以到保存的output_dir中查看训练日志，包括训练损失、验证损失。

五、chat

更新适配器，选择模型即可。如果不用这种方式，训练好的模型和其他大模型调用方式是一样的。

点赞+关注就是最好的打赏

53AI，大模型落地应用首选服务商

定位：开箱即用的大模型落地应用平台

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

年轻人！来一起搞AI吗?

如果你看见AI对商业世界的变革，欢迎来和我们一起探索~

岗位：销售经理

查看详情

岗位：项目经理

查看详情

岗位：产品经理

查看详情

岗位：测试工程师

查看详情

160+中大型企业正在使用53AI

立即咨询申请演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

神经网络算法 - 一文搞懂模型预训练Pre-training

2024-04-24

最强 GPT 免费使用！GPT4O 开启多模态新时代！

2024-05-14

实测：本地跑llama3:70B需要什么配置

2024-04-24

超简单在本地部署Llama3的方案

2024-04-23

“大数据+”医疗

2024-04-11

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

RAG系列04：使用ReRank进行重排序

2024-03-22

吴恩达站台畅聊Agent Workflow 以及 4 种主流设计模式，LLM应用开发的新热点

2024-03-29

MaxKB：基于LLM大语言模型开箱即用的知识库问答系统

2024-04-25

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

2024-04-12

大家都在问

ChatGPT Mac 版应用向所有用户免费开放，如何下载使用？

2024-06-29

如何花3400配置一台室内无噪音，48GB显存的深度学习服务器？

2024-06-29

AI结合游戏NPC会发生什么？

2024-06-29

再见了，百度文库！没想到打败你的竟然是秘塔AI文库？

2024-06-29

如何使用Anthropic最强AI模型Claude 3.5 Sonnet？

2024-06-29

AI Agent：企业和我们普通人能做什么？

2024-06-28

开源大模型巅峰对决！谷歌Gemma2被国产开源大模型秒了？

2024-06-28

Multi-Agent ，知多少？

2024-06-28

企业大模型落地应用平台

全员+AI

业务+AI

AIx业务

大模型咨询

大模型定制

年轻人！来一起搞AI吗?

岗位：销售经理

岗位：项目经理

岗位：产品经理

岗位：测试工程师

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

神经网络算法 - 一文搞懂模型预训练Pre-training

最强 GPT 免费使用！GPT4O 开启多模态新时代！

实测：本地跑llama3:70B需要什么配置

超简单在本地部署Llama3的方案

“大数据+”医疗

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

RAG系列04：使用ReRank进行重排序

吴恩达站台畅聊Agent Workflow 以及 4 种主流设计模式，LLM应用开发的新热点

MaxKB：基于LLM大语言模型开箱即用的知识库问答系统

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

大家都在问

ChatGPT Mac 版应用向所有用户免费开放，如何下载使用？

如何花3400配置一台室内无噪音，48GB显存的深度学习服务器？

AI结合游戏NPC会发生什么？

再见了，百度文库！没想到打败你的竟然是秘塔AI文库？

如何使用Anthropic最强AI模型Claude 3.5 Sonnet？

AI Agent：企业和我们普通人能做什么？

开源大模型巅峰对决！谷歌Gemma2被国产开源大模型秒了？

Multi-Agent ，知多少？

企业大模型落地应用平台

全员+AI

业务+AI

AIx业务

大模型咨询

大模型定制

年轻人！来一起搞AI吗?

岗位：销售经理

岗位：项目经理

岗位：产品经理

岗位：测试工程师

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

神经网络算法 - 一文搞懂模型预训练Pre-training

最强 GPT 免费使用！GPT4O 开启多模态新时代！

实测：本地跑llama3:70B需要什么配置

超简单在本地部署Llama3的方案

“大数据+”医疗

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

RAG系列04：使用ReRank进行重排序

吴恩达站台畅聊Agent Workflow 以及 4 种主流设计模式，LLM应用开发的新热点

MaxKB：基于LLM大语言模型开箱即用的知识库问答系统

OLLama详细的 api 介绍 不完全指南 python 直接调用 OLLama api 翻译助手演示

大家都在问

ChatGPT Mac 版应用向所有用户免费开放，如何下载使用？

如何花3400配置一台室内无噪音，48GB显存的深度学习服务器？

AI结合游戏NPC会发生什么？

再见了，百度文库！没想到打败你的竟然是秘塔AI文库？

如何使用Anthropic最强AI模型Claude 3.5 Sonnet？

AI Agent：企业和我们普通人能做什么？

开源大模型巅峰对决！谷歌Gemma2被国产开源大模型秒了？

Multi-Agent ，知多少？

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示