我要投稿

全面的大模型训练、推理工具包LLMBox来了！

发布日期：2024-05-11 07:52:03 浏览次数： 2611

作者：RUC AI Box

微信搜一搜，关注“RUC AI Box”

在2023年3月，我们发表了大语言模型综述文章《A Survey of Large Language Models》，目前已经更新到第13个版本，自上线以来受到了不少读者的关注。在几周之前，我们完成了中文版书籍《大语言模型》的初稿。中文版书籍注重为大模型技术的入门读者提供讲解，力图展现一个整体的大模型技术框架和路线图。

英文综述链接：

https://arxiv.org/abs/2303.18223

中文书项目链接：

https://llmbook-zh.github.io

作为《大语言模型》综述和书籍的配套资源，我们开发了一个代码工具库LLMBox，供研究人员使用。LLMBox代码库包含统一的训练流程和全面的模型评估框架，旨在成为训练和使用大语言模型的一站式解决方案。

工具库链接：

https://github.com/RUCAIBox/LLMBox

LLMBox内部集成了许多实用的功能，实现了训练和使用阶段高度的灵活性和效率。比如在训练阶段，我们支持预训练、指令微调、对齐微调等训练策略，高效数据处理策略和统一的数据集混合等功能；在使用阶段，我们有全面的评测模型和数据集支持、常见评测设置、高效评测等功能。在接下来的一段时间，我们还会发出十余期LLMBox的详细使用教程，涵盖从入门到进阶的大模型训练和使用方法，以帮助读者加深实践经验。

训练部分

多种训练策略：支持预训练（PT）、指令微调（SFT）、对齐微调（PPO 和DPO）
全面的 SFT 数据集：支持 9 个 SFT 数据集
词汇表合并：支持词表合并功能
构建数据集：支持自定义多数据集混合、Self-Instruct 和 Evol-Instruct
参数高效的微调：支持 LoRA 和 QLoRA
高效训练：支持 FlashAttention 和 Deepspeed

使用部分

全面评估：支持 53+ 常用数据集
上下文学习：支持 KATE、GlobalE 和 APE 等 ICL 策略
思维链：支持 base、least to most和 PAL 三种 CoT 策略
评估方法：支持针对多选题或生成题的四种常见评估方法
前缀缓存：通过缓存前缀的 past_key_value，可以将推理速度提高至多 6 倍
高效推理：支持 vLLM 和 FlashAttention 支持
量化：支持 bitsandbytes 和 GPTQ 量化

接下来的几期推送将先介绍评测和使用部分，从国内下载模型开始，到如何加速实验、量化推理，再到如何用LLMBox复现论文中常见的评测基线，包括CoT、ICL等策略。

然后是用LLMBox训练模型的部分，从训练模型前的高效训练配置、显存估计和词表扩充，到四种模型训练策略的详细使用指导（PT、SFT、PPO和DPO），其中还包括参数高效微调使用介绍，再到使用LLMBox进行大模型指令生成，包括Evol-instruct和Self-instruct两种策略。

如果在使用中遇到相应的问题或者不完善的功能，欢迎在GitHub Issue

（https://github.com/RUCAIBox/LLMBox/issues）中反馈！

LLMBox往期回顾

大模型综述出书了

大模型综述11月最新升级

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

高效 Agents 构建指南

2025-05-23

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

从RAG到CoT再到MCP，一文读懂AI Agent落地难题｜大模型研究

2025-05-07

大家都在问

从谨慎检查到一键接受，TRAE 如何成为我的主力 IDE？

2025-07-10

垂直赛道 Agent 闷声发财指南：如何实现一年超千万营收？

2025-07-10

你的大脑真的在被AI“腐蚀”吗？

2025-07-10

如何在 Elasticsearch 中构建你的智能 AI 助手？

2025-07-09

AI大模型落地最后一公里：RAG？

2025-07-09

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

🧠提示词的魔力：Prompt 为什么能控制大模型？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

2025-07-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部