微信扫码
添加专属顾问
我要投稿
阿里云Qwen3系列大模型震撼发布,性能全面升级,创新双模式思考能力引领大模型新潮流。核心内容:1. Qwen3系列包含8款不同规模模型,最大模型参数量达235B2. 创新双模式思考能力,大幅提升模型在复杂任务和简单任务的表现3. Qwen3已登陆各大平台,支持多种部署方式,性能全面提升
大模型圈又要热闹了!
就在刚刚,阿里云正式发布了 Qwen(通义千问)系列大模型的最新成员 —— Qwen3。这次发布包含了 8 个不同规模的模型,其中最大的模型有 235B 参数。
Qwen3 的旗舰模型是 Qwen3-235B-A22B。这个模型在代码、数学和通用能力等方面的测试中,已经可以和 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型一较高下。
Qwen3 系列包括:
2 个 MoE 模型:Qwen3-235B-A22B 和 Qwen3-30B-A3B
6 个标准模型:从 0.6B 到 32B 不等
Qwen3 最大的创新是支持两种思考模式:
思考模式:模型会一步步推理,适合复杂问题。比如做数学题时,模型会像人类一样先分析问题,再逐步解答。
快速模式:模型直接给出答案,适合简单问题。比如问候、闲聊这类问题,模型会立即回应。
用户可以根据需要切换这两种模式。测试数据显示,在思考模式下,模型在 AIME(美国数学邀请赛)和 GPQA(通用问答)等任务上的表现会随着思考时间的增加而提升。
Qwen3 的训练数据比上一代翻了一倍多:
训练数据来源广泛:
训练过程分三步:
Qwen3 采用了四阶段后训练流程:
对于轻量级模型(如 Qwen3-4B/8B/14B),还使用了知识蒸馏技术,把大模型的能力传授给小模型。
小模型也有大能力!Qwen3 的小型 MoE 模型 Qwen3-30B-A3B 只用了 QwQ-32B 十分之一的参数量,就取得了更好的效果。
就连最小的 Qwen3-4B 模型,也能达到 Qwen2.5-72B-Instruct 的水平。
Qwen3 现在已经登陆各大平台:
开发者可以用多种方式部署 Qwen3:
访问 https://chat.qwen.ai/ 在线体验。也可以在 App 上进行体验。
Qwen3 支持 119 种语言,这让它可以服务全球用户。不管是中文、英文,还是小语种,Qwen3 都能应对自如。
就在 Qwen3 发布前,业内有爆料传出 DeepSeek R2 即将发布的消息。据说这个模型有这些特点:
大模型领域的竞争正在加剧。Qwen3 的发布表明:
这个五一假期,大模型圈注定不会平静。让我们拭目以待更多精彩的发展!
扫描以下二维码加小编微信,备注 “ai”,一起交流 AI 技术!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-29
阿里 Qwen3 技术详解: 4B 参数媲美 72B,MoE 架构的开源突破
2025-04-29
PAI-Model Gallery 支持云上一键部署 Qwen3 全尺寸模型
2025-04-29
Qwen3中性能最强MOE模型部署抛砖引玉 + 实测
2025-04-29
体验了最新的Qwen3之后,端侧之王果然没有让我失望!
2025-04-29
Qwen3 重磅开源!
2025-04-29
Qwen3深夜正式开源,小尺寸也能大力出奇迹。
2025-04-29
猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
2025-04-29
阿里Qwen3正式发布:最小6亿参数,叫板Gemini-2.5Pro
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-08-13
2024-12-26
2025-04-28
2025-04-28
2025-04-28
2025-04-21
2025-04-19
2025-04-17
2025-04-15
2025-04-13