我要投稿

千问1.5B模型跑赢70B大模型，72B 吊打GPT-4

发布日期：2024-08-11 04:33:31 浏览次数： 2707 作者：AGI Hunt

最近"小模型革命"确实火?

今天我们又迎来了一位新的小将，它可不简单，能在某些任务上吊打那些大块头的存在！

没错，就是这个看起来不起眼的1.5B模型！

它在MATH基准测试中拿到了69.4分的好成绩，这个分数已经超越了不少70B的大模型了。

这是什么概念？就相当于班里的"小个子"同学突然在数学考试中一骑绝尘，把那些平时成绩不错的"大个子"们都甩在了身后！

更让人惊喜的是，这个小模型的硬件需求极其亲民：

FP16精度下只需要3GB显存
INT8精度下只需要1.5GB显存
INT4精度下只需要750MB显存

这意味着什么呢？

就连那些"显卡穷"的小伙伴们也能玩得转了！

再也不用羡慕别人家的3090Ti了，自家的"破显卡"也能跑出不错的效果。

这个模型是Qwen团队最新发布的Qwen2-Math系列中的一员。除了这个1.5B的"小不点"，他们还发布了7B和72B的版本。

72B版本还在MATH基准上拿到了84分的高分，7B版本也有75分，这些成绩都超越了GPT-4o和Claude 3.5在某些数学任务上的表现。

更让人兴奋的是，1.5B和7B版本都是Apache 2.0开源协议，这意味着大家都可以自由使用和修改。至于72B版本，虽然使用了Qianwen协议，但也提供了基础版和指令微调版供大家选择。

有网友调侃道：

"这不就是AI界的'David VS Goliath'吗？小小的1.5B模型竟然能在某些任务上击败70B的巨人，简直是'以小搏大'的经典案例啊！"

这个案例再次证明，不是体型大就一定厉害。有时候，一个精心设计和训练的小模型，也能在特定任务上发挥出惊人的实力。

那么，Qwen团队是如何做到的呢？他们的秘诀包括：

在数学特定数据和合成数据上进行进一步预训练
使用RM+拒绝采样构建SFT数据
在SFT之后执行GRPO
对预训练和指令数据集进行精确匹配和13-gram去重的数据清洗

不得不说，Qwen团队这波操作真是既有创新又下足了功夫！

最后，让人欣喜的是，这个模型已经集成到了?Transformers中，这无疑会让更多的开发者和研究者能够方便地使用和研究这个模型。

有网友激动地表示：

"这简直是给我们这些'GPU穷人'的福音啊！终于不用羡慕别人的'显卡豪宅'了，自己的'显卡蜗居'也能跑出不错的效果。Qwen团队，你们是我们的'AI罗宾汉'！"

这个1.5B模型的出现，为那些计算资源有限的个人开发者和小团队带来了新的希望。它证明了在AI的世界里，智慧和创新比单纯的规模更重要。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-22

谷歌 Gemini 2.5 Pro 成首款能理解 PDF 布局的 AI 模型了

2025-04-22

Ray 在微信 AI 计算中的大规模实践

2025-04-22

字节扣子空间首秀：AI Agent 真正落地，不再只是一个“聊天机器人”

2025-04-22

阿里、蚂蚁、腾讯纷纷推出 AI 组件库，React / Vue 全覆盖，AI 组件库超全汇总来啦！

2025-04-22

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

我对2025年AI发展的几点预测

2025-04-21

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

从“大模型热”到“Agent 潮”，“真风口”还是“伪命题”？

2025-04-21

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB