微信扫码
添加专属顾问
我要投稿
阿里推出的Qwen系列,性能强悍,界面简洁,全球开源模型数量第一。 核心内容: 1. Qwen系列的界面设计和用户体验 2. Qwen系列在全球开源模型中的地位和影响力 3. Qwen系列超大模型的四大应用场景
百度、阿里、腾讯、头条大公司推出模型中,阿里这个 Chatbot页面设计得足够简洁,可以说,最像 ChatGPT的。地址是:https://chat.qwen.ai
电脑端、手机端,界面都干净直观,效果一致;这种设计不是路径依赖,而是「外形依赖」;模仿 ChatGPT极简风格,让用户觉得特别方便:想用就直接上手,不用折腾。
整体来看,这个平台似乎整合了阿里所有模型的能力。
我查了一下最新数据,Qwen系列的衍生模型数量已经突破 9 万个,成为全球开源模型数量的第一名,甚至超过Meta的Llama 系列。
Hugging Face 数据也显示,基于Qwen 系列二次训练的衍生模型高达 5 万多个;这说明 Qwen 系列在开源市场上非常有影响力。
不过,既然阿里已经有通义、夸克这些产品了,为什么又单独搞了个 qwen.ai ?这个地址接入的 9 个模型到底是干嘛的?
我观察到,qwen.ai地址更像为想直接使用模型的人设计的一个 Chatbot;不过,这里接入的模型基本是超大模型或高性能模型。
比如:Qwen2.5-Max ,虽然官方没明确说它是千亿参数模型,但根据阿里的命名规则,「Max」通常代表最大参数规模,甚至可能接近千亿级别。
而且,模型后面还有一行小字:最强大的千万语言模型。我猜,这个模型可能是阿里为未来iPhone智能助手这类场景准备的。
既然如此,一个接近千亿参数的模型到底能干嘛呢?我觉得主要有四点:
首先,它是一个超大规模的知识库,世界最大的图书馆跟它比起来都显得小。无论是医生诊断疾病、律师解答法律问题,还是科学家研究新药,甚至想从一堆文档里快速找到关键信息,它都能分分钟给出答案,只有你想不到,没有它做不到。
其二,它能帮完成特别复杂的任务。
想让它同时处理文字、图片、视频,生成一些高质量的东西,完全没问题。你也可以给它一些烧脑的问题,类似于,预测天气、设计新分子结构,它也能几秒钟内给出答案;我测试过几次,确实很强大。
第三,它可以扮演各种角色。
什么角色呢?情感导师、画画、编程?不止如此。昨天,我对它说:你是一名顶级心理学研究者,请从专业角度分析某个问题。它的回答往往让我眼前一亮,超越了我的认知边界。
再有一点就与科技有关了。这个模型能帮你加速科学发现。预测蛋白质折叠、跨领域知识融合等,它的回答都非常专业。
所以,一个千亿参数的模型,不只是「聪明」那么简单,更像一个无所不能的超级工具。
我问了下它,你的最新知识库时间是什么时候,它说:2024年12月;这意味着,两个月前的知识都已经存储在它的大脑中。
除Qwen2.5-Max,这里还有Qwen2.5-Plus(擅长处理复杂任务)、Qwen2.5-VL-75B-Instruct (最大视觉模型)、Qwen2.5-Coder-32B-Instruct (专精编程)等。
我发现,模型还可以组合使用,比如用 Qwen2.5-Plus 的同时调用一个编程模型。
另外,昨天凌晨 5 点,阿里发布深度思考 (QwQ) 模型,官方介绍说它擅长数学理解、编程和AI 智能体等任务,如果把它的能力和其他模型结合起来,简直就是性能小怪兽。
我还注意到,这次新增联网搜索功能(之前没有),但文生图、文生视频功能暂时还未开放;也有用户反馈说推理模型偶尔会出错,毕竟这是 Preview(预览版),还需要时间进一步完善。
尽管如此,即使是千亿参数的大模型,在处理内容时仍然存在幻觉问题。
昨天写一篇文章,误把 DeepSeek 创始人梁文锋写成桑文锋 (神策数据的创始人)。把 4000 字的内容交给模型检查,结果它没发现这个错误。这种问题提醒我们,大模型并非万能。
可能是因为内容太长,或者对话次数多了,模型就容易「迷糊」了吧。
用 qwen.ai 还有一个小技巧:如果用苹果电脑,觉得窗口太大影响操作,可以点击 Safari 浏览器右上角,共享按钮,将页面添加到程序坞,然后缩小窗口。这样桌面就成了一个高效的工作台。
目前它也有一个痛点:不支持语音输入。
不过,这对我来说不是大问题,因为一般会用豆包的语音功能解决。通过快捷键呼出语音输入,对着电脑说完后直接转成文字,粘贴过去就行,非常方便。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-10
用MCP Server为你的大模型应用插上翅膀
2025-03-10
Markify:专为 LLM 优化的开源文档解析神器,轻松破解 PDF 难题!
2025-03-10
Manus太火爆MetaGPT又开源OpenManus-RL引入强化学习;多智能体协作框架OWL
2025-03-10
一键包:新开源TTS,零样本克隆声音,还能自主创建声音,只需要6G显存,文末一键包
2025-03-09
LLM运行框架对比:ollama与vllm浅析
2025-03-09
真·企业级方案!MindSQL开源:四种训练方式+私有数据+RAG+生产高并发
2025-03-09
智能体的互联网时代来临,相当于http协议的MCP协议让智能体与数据源无缝连接
2025-03-09
Manus背后的核心技术:如何通过MCP简化AI集成
2025-01-01
2024-07-25
2024-05-06
2025-01-21
2024-09-20
2024-07-20
2024-06-12
2024-08-13
2024-12-26
2024-07-11
2025-03-08
2025-03-03
2025-03-02
2025-03-01
2025-02-26
2025-02-23
2025-02-18
2025-02-15