我要投稿

XTuner 微调 Llama3

发布日期：2024-05-02 11:24:36 浏览次数： 2162

作者：周同学带您玩AI

微信搜一搜，关注“周同学带您玩AI”

““[
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    },
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    }
]””

以上内容是一个 JSON 格式的数据结构，它包含了两个对象，每个对象中都有一个名为 "conversation" 的键，对应着一个包含对话信息的数组。

每个对话信息都是一个对象，包含三个键："system"、"input" 和 "output"。

"system" 键表示对话信息的来源，可能是系统（即机器人）或者用户。
"input" 键表示用户输入的内容。
"output" 键表示系统（机器人）对用户输入的响应。

这段 JSON 数据的结构用于存储对话信息，可用于构建对话系统，记录用户和系统之间的交互。

“”xtuner train configs/assistant/llama3_8b_instruct_qlora_assistant.py --work-dir /root/llama3_pth

是一个命令行指令，用于启动一个名为 "xtuner" 的程序，并指定了一些参数。

"xtuner" 是要执行的程序的名称。
"train" 是 "xtuner" 程序的一个参数，指示程序执行训练任务。
"configs/assistant/llama3_8b_instruct_qlora_assistant.py" 是一个配置文件的路径，该文件用于指定模型的配置信息，包括模型的结构、超参数等。
"--work-dir" 是一个选项参数，用于指定工作目录，即模型训练过程中产生的文件（如日志、模型参数等）存放的位置。
"/root/llama3_pth" 是指定的工作目录的路径。

启动 "xtuner" 程序进行模型训练，使用指定的配置文件来配置模型，训练过程中的相关文件将保存在指定的工作目录中。

# Adapter PTH 转 HF 格式
xtuner convert pth_to_hf /root/llama3_pth/llama3_8b_instruct_qlora_assistant.py \
  /root/llama3_pth/iter_500.pth \
  /root/llama3_hf_adapter

# 模型合并
export MKL_SERVICE_FORCE_INTEL=1
xtuner convert merge /root/model/Meta-Llama-3-8B-Instruct \
  /root/llama3_hf_adapter\
  /root/llama3_hf_merged

Adapter PTH 转 HF 格式：

xtuner convert pth_to_hf: 这是一个命令行指令，表示要使用 "xtuner" 程序进行文件格式的转换，将 PyTorch 模型文件（.pth 格式）转换为 Hugging Face 模型文件（HF 格式）。
/root/llama3_pth/llama3_8b_instruct_qlora_assistant.py：是指定的 PyTorch 模型文件的路径。
/root/llama3_pth/iter_500.pth：是指定的 PyTorch 模型文件的权重文件路径。
/root/llama3_hf_adapter：是指定的转换后的 Hugging Face 模型文件的保存路径。

模型合并：

export MKL_SERVICE_FORCE_INTEL=1：这是一个环境变量设置，用于强制使用 Intel 的 MKL 服务。
xtuner convert merge：这是另一个 "xtuner" 程序的命令行指令，表示要进行模型合并操作。
/root/model/Meta-Llama-3-8B-Instruct：是指定要合并的第一个模型文件的路径。
/root/llama3_hf_adapter：是指定要合并的第二个模型文件的路径，这个路径是之前转换得到的 Hugging Face 模型文件的路径。
/root/llama3_hf_merged：是指定合并后的模型文件的保存路径。

用于将一个 PyTorch 模型文件转换为 Hugging Face 模型文件，并将其与另一个模型文件进行合并，最终得到一个新的模型文件。

streamlit run ~/Llama3-XTuner-CN/tools/internstudio_web_demo.py \
  /root/llama3_hf_merged

启动 Streamlit 应用程序：

streamlit run：这是用于运行 Streamlit 应用程序的命令。
~/Llama3-XTuner-CN/tools/internstudio_web_demo.py：是指定要运行的 Streamlit 应用程序的 Python 文件路径。

传递参数：

/root/llama3_hf_merged：这是通过命令行传递给 Streamlit 应用程序的参数。在这个上下文中，它可能是指定了一个模型文件或者其他必要的数据文件的路径。

使用 Streamlit 运行一个名为 "internstudio_web_demo.py" 的 Python 文件，并将 /root/llama3_hf_merged 作为参数传递给这个应用程序。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

15个最佳开源 RAG 框架选型指南

2025-04-13

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

大家都在问

微软裁员9000人！给员工整不会了：用不用AI都要被裁？

2025-07-05

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

大模型开源，厂商靠什么盈利？

2025-07-04

智能体（Agent）是怎么知道什么时候要调用 Tool 的？

2025-07-04

Prompt 到底有啥用？为什么写得好能提升 AI 效果这么多？

2025-07-04

AI狂潮下：大公司如何破解"创新者窘境"？

2025-07-04

Anthropic多智能体如何破解企业级任务并行处理瓶颈？

2025-07-03

OpenAI首席研究官没有博士学位，你的985还有用吗？

2025-07-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB