支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


阿里Qwen3正式发布:最小6亿参数,叫板Gemini-2.5Pro

发布日期:2025-04-29 07:56:52 浏览次数: 1558 作者:AI寒武纪
推荐语

阿里Qwen3系列,挑战行业巨头,性能与效率兼备的AI新选择。

核心内容:
1. Qwen3系列模型参数规模与性能特点
2. 与行业顶级模型基准测试结果对比
3. 小型MoE模型与Dense模型的性能表现

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家


 

阿里宣布推出 Qwen3系列#Qwen3

开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型

此外,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源

这里可以直接免费体验:

chat.qwen.ai

按照千问官方的说法:旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果

此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能

一图读懂:

 



⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~




求赞??


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询