AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


通义千问Qwen2.5开源,媲美Llama3.1-405B
发布日期:2024-09-19 08:50:48 浏览次数: 1846


通义千问Qwen2.5开源,媲美Llama3.1-405B

介绍

就在今天早些时候,阿里发布了新的语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型,包括:

  • • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B;

  • • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B;

  • • Qwen2.5-Math: 1.5B, 7B, 以及72B。

Qwen2.5 所有模型都在最新的大规模数据集上进行了预训练,该数据集包含多达 18T tokens。新模型在指令执行、生成长文本(超过 8K 标记)、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。Qwen2.5 模型总体上对各种system prompt更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。与 Qwen2 类似,Qwen2.5 语言模型支持高达 128K tokens,并能生成最多 8K tokens的内容。它们同样保持了对包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等 29 种以上语言的支持。我们在下表中提供了有关模型的基本信息。

专业领域的编程模型 Qwen2.5-Coder 和数学模型 Qwen2.5-Math,相比其前身 CodeQwen1.5 和 Qwen2-Math 有了实质性的改进。具体来说,Qwen2.5-Coder 在包含 5.5 T tokens 编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。同时,Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。

以下是整体的模型参数信息介绍:

模型性能

Qwen2.5-72B在多个基准测试中展示了经过指令调优的版本的综合结果,评估了模型的能力和人类偏好。从评测结果可以看到全方位领先Llama3.1-70B,甚至在部分优于Llama3.1-405B。

Qwen2.5-72B 的基础语言模型性能达到了顶级水准,同样是在与 Llama-3-405B 这样更大的模型对比时也不落下风。

Qwen2.5重新发布了140 亿参数和 320 亿参数模型,即Qwen2.5-14B 和 Qwen2.5-32B。两款指令微调模型在多样化的任务中超越了同等规模或更大规模的基线模型,例如 Phi-3.5-MoE-Instruct 和 Gemma2-27B-IT。

Qwen2.5-3B小参数模型仅凭约 30 亿参数就实现了Qwen2-7B、Llama3-8B、MiniCPM3-4B的同等性能,展示了其相对于前辈模型的高效性和能力。

Qwen2.5-Coder编程模型的性能也基本全方位领先于其他模型,如DeepSeek-Coder 33B-Instruct和CodeStral-22B。

Qwen2.5-Math相比于上个月刚刚发布的 Qwen2-Math,在更大规模的数学相关数据上进行了预训练,并且增加了对中文的支持,并通过赋予其进行 CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)的能力来加强其推理能力。Qwen2.5-Math-72B-Instruct 的整体性能超越了 Qwen2-Math-72B-Instruct 和 GPT4-o,甚至是非常小的专业模型如 Qwen2.5-Math-1.5B-Instruct 也能在与大型语言模型的竞争中取得高度竞争力的表现。

支持框架

  • • Finetuning: ChatLearnLlama-FactoryAxolotlFireflySwiftXTunerUnslothLiger Kernel

  • • Quantization: AutoGPTQAutoAWQNeural Compressor

  • • Deployment: vLLMSGLSkyPilotTensorRT-LLMOpenVinoTGI

  • • API Platforms: TogetherFireworksOpenRouter

  • • Local Run: MLXLlama.cppOllamaLM StudioJan

  • • Agent and RAG Frameworks: DifyLlamaIndexCrewAI

  • • Evaluation: LMSysOpenCompassOpen LLM Leaderboard

  • • Model Training: Arcee AISailorDolphinOpenbuddy

昨天发布的最新版的ollama-0.3.11已支持Qwen2.5

参考

https://qwenlm.github.io/zh/blog/qwen2.5/


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询