我要投稿

Qwen：性能猛兽，简单至上

发布日期：2025-03-01 06:50:33 浏览次数： 1695 作者：王智远

百度、阿里、腾讯、头条大公司推出模型中，阿里这个 Chatbot页面设计得足够简洁，可以说，最像 ChatGPT的。地址是：https://chat.qwen.ai

电脑端、手机端，界面都干净直观，效果一致；这种设计不是路径依赖，而是「外形依赖」；模仿 ChatGPT极简风格，让用户觉得特别方便：想用就直接上手，不用折腾。

整体来看，这个平台似乎整合了阿里所有模型的能力。

我查了一下最新数据，Qwen系列的衍生模型数量已经突破 9 万个，成为全球开源模型数量的第一名，甚至超过Meta的Llama 系列。

Hugging Face 数据也显示，基于Qwen 系列二次训练的衍生模型高达 5 万多个；这说明 Qwen 系列在开源市场上非常有影响力。

不过，既然阿里已经有通义、夸克这些产品了，为什么又单独搞了个 qwen.ai ？这个地址接入的 9 个模型到底是干嘛的？

我观察到，qwen.ai地址更像为想直接使用模型的人设计的一个 Chatbot；不过，这里接入的模型基本是超大模型或高性能模型。

比如：Qwen2.5-Max ，虽然官方没明确说它是千亿参数模型，但根据阿里的命名规则，「Max」通常代表最大参数规模，甚至可能接近千亿级别。

而且，模型后面还有一行小字：最强大的千万语言模型。我猜，这个模型可能是阿里为未来iPhone智能助手这类场景准备的。

既然如此，一个接近千亿参数的模型到底能干嘛呢？我觉得主要有四点：

首先，它是一个超大规模的知识库，世界最大的图书馆跟它比起来都显得小。无论是医生诊断疾病、律师解答法律问题，还是科学家研究新药，甚至想从一堆文档里快速找到关键信息，它都能分分钟给出答案，只有你想不到，没有它做不到。

其二，它能帮完成特别复杂的任务。

想让它同时处理文字、图片、视频，生成一些高质量的东西，完全没问题。你也可以给它一些烧脑的问题，类似于，预测天气、设计新分子结构，它也能几秒钟内给出答案；我测试过几次，确实很强大。

第三，它可以扮演各种角色。

什么角色呢？情感导师、画画、编程？不止如此。昨天，我对它说：你是一名顶级心理学研究者，请从专业角度分析某个问题。它的回答往往让我眼前一亮，超越了我的认知边界。

再有一点就与科技有关了。这个模型能帮你加速科学发现。预测蛋白质折叠、跨领域知识融合等，它的回答都非常专业。

所以，一个千亿参数的模型，不只是「聪明」那么简单，更像一个无所不能的超级工具。

我问了下它，你的最新知识库时间是什么时候，它说：2024年12月；这意味着，两个月前的知识都已经存储在它的大脑中。

除Qwen2.5-Max，这里还有Qwen2.5-Plus（擅长处理复杂任务）、Qwen2.5-VL-75B-Instruct （最大视觉模型）、Qwen2.5-Coder-32B-Instruct （专精编程）等。

我发现，模型还可以组合使用，比如用 Qwen2.5-Plus 的同时调用一个编程模型。

另外，昨天凌晨 5 点，阿里发布深度思考 (QwQ) 模型，官方介绍说它擅长数学理解、编程和AI 智能体等任务，如果把它的能力和其他模型结合起来，简直就是性能小怪兽。

我还注意到，这次新增联网搜索功能（之前没有），但文生图、文生视频功能暂时还未开放；也有用户反馈说推理模型偶尔会出错，毕竟这是 Preview（预览版），还需要时间进一步完善。

尽管如此，即使是千亿参数的大模型，在处理内容时仍然存在幻觉问题。

昨天写一篇文章，误把 DeepSeek 创始人梁文锋写成桑文锋（神策数据的创始人）。把 4000 字的内容交给模型检查，结果它没发现这个错误。这种问题提醒我们，大模型并非万能。

可能是因为内容太长，或者对话次数多了，模型就容易「迷糊」了吧。

用 qwen.ai 还有一个小技巧：如果用苹果电脑，觉得窗口太大影响操作，可以点击 Safari 浏览器右上角，共享按钮，将页面添加到程序坞，然后缩小窗口。这样桌面就成了一个高效的工作台。

目前它也有一个痛点：不支持语音输入。

不过，这对我来说不是大问题，因为一般会用豆包的语音功能解决。通过快捷键呼出语音输入，对着电脑说完后直接转成文字，粘贴过去就行，非常方便。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-17

无需运维！Dify+Ollama 点选式搭建DeepSeek大模型，太绝了!!!

2025-04-17

OpenAI发布o3与o4-mini，还开源两个项目

2025-04-17

OpenAI开源的Codex CLI是什么？

2025-04-17

社区供稿 | 3700 次预训练总结超参规律，开源海量实验，告别盲猜

2025-04-17

好用的开源Agent框架概览与比较分析

2025-04-17

OpenAI开源超火Agent，5小时破5000颗星，霸榜Github

2025-04-17

复刻小智AI，ESP32-S3搭建Arduino+ESP-SR+ESP-TTS开发环境踩坑记录

2025-04-17

openai-python v1.74.0 震撼发布！GPT-4.1 家族来袭，开发者必看更新解析！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

为什么大模型本地部署后“没了下文”？

2025-04-03

阿里搞了个大新闻！这AI能听会看还会实时唠嗑，科幻片都不敢这么拍？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB