我要投稿

通义千问2.5发布：开源大模型中文智能程度直逼GPT4

发布日期：2024-05-10 21:27:54 浏览次数： 3197 作者：平凡的平凡

AI领域追求极致，大模型更是其中的典范。近几年涌现了众多现象级大模型，ChatGPT引领了这股浪潮。它遵循团队提出的scaling law不断迭代，据传GPT-4拥有1万亿参数。

除了极大模型，谷歌、微软和阿里等公司也发布了参数量在几亿到几十亿的模型。近期发布的Llama3在网络结构上变化不大，但数据量增加了7倍，性能显著提升。

总的来说，成功的大模型在某些方面都做到了极致。

大模型领域最大的竞争在于开源和闭源之间，这种竞争涉及方方面面。

上图展示了开源和闭源在使用成本、创新、支持、自定义和知识产权上的优劣。以国内为例，总的来说闭源大模型性能体验还不错，但由于完全黑盒，企业用户并不敢轻易采用。

相对而言，阿里的通义千问选择了极致开源，从0.5B、1.8B、4B、7B的小型模型，到14B、32B的中等模型，再到72B、110B的大型模型，一整个全尺寸大语言模型开源。除了语言模型，通义千问还把多模态大模型（视觉理解模型Qwen-VL、音频理解模型Qwen-Audio）开源了。代码大模型CodeQwen1.5、混合专家模型Qwen1.5-MoE也源了。你说这品类齐不齐全。直观感觉是毫无保留了。

而且他们开源出来的东西都还挺能打。比如，在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上，Qwen1.5-72B-Chat模型多次进入“盲测”结果全球Top 10，作为中国唯一代表，与海外大模型相PK。

最新通义千问1100亿参数开源模型Qwen1.5-110B模型，在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，登顶HuggingFace开源大模型排行榜Open LLM Leaderboard，成为开源领域最强大模型。

很长一段时间，ChatGPT、GPT4是公认最强LLM。由于它闭源，所以有些观点认为，闭源大模型的能力深不可测。这方面，通义千问团队也一直在追赶。最新发布的通义千问2.5，性能在中文场景下已经追平GPT-4 Turbo，成为最强中文大模型。

我的观点很简单：开源和闭源并非绝对对立，而是相互促进。

开源和闭源在大模型领域其实特别像安卓和苹果手机的关系，安卓手机对于想要自己整活的选手特别友好，但是苹果手机就很难做到跟安卓一样的可定制化。开源大模型的优势非常的简单直观。

1 信息本地存储，增强数据安全性和隐私保护

开源大模型的使用非常的简单，简单来说就两步，下载模型，然后运行，比如在Ollama里面用Qwen系列，你只需要一行代码：ollama run qwen

在这个过程中，你无需联网、输入账号密码或验证码。开源大模型可以完全在本地运行，你与大模型的聊天内容完全在本地电脑处理，无需担心数据泄漏。

2 高度定制化，满足特定企业以及个人需求

OpenAI提供了非常的接口，有语音的，有图像的，有微调大模型，接口设计的非常易用，价格也一调再调，现如今的使用成本已经降低很多了。

但是依旧存在问题，就是它毕竟是闭源大模型，特别是跟品类特别齐全的开源大模型相比，比如你看Ollama里面的Qwen系列，它提供了非常多的版本可以选择，你要速度快就用小规模参数，反之则有千亿参数级别的开源模型Qwen1.5-110B可以用。

更重要的，开源意味着你可以随便改他们的模型，换他们的训练数据，甚至改造成特定领域的大模型。

因为代码给你了，IP给你了，甚至连训练好的模型参数都给你了，这里面的想象空间就太大了。

你可以看到，通义千问已经跟很多企业或者组织开展了合作，各种对话机器人、语音助手等等。

通用大模型+领域知识 = 神器，毫无疑问，之前看到一个案例，养殖业几十年的经验+数据，Qwen可以很快掌握且直接变成知无不答的机器人供给新人学习甚至直接使用。

特别是开源对于闭源的追赶速度其实飞快，你可以看到，下面这个图里面开源大模型的增长速度明显快过闭源大模型。

这足以看得出来开源大模型的发展潜力以及超高速的迭代速度，如果你经常使用大模型的话，通义千问现在的使用体验已经非常接近gpt4了，处理文件、联网搜索，体验非常的接近。

极端一点儿，如果没有开源大模型带来的压力，估计GPT4会在很长一段时间内不会有更新。开源大模型所特有的高度可定制化，在未来一段时间内会在AI应用以及生态上展现其特殊性。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

PAI-Model Gallery 支持云上一键部署 Qwen3 全尺寸模型

2025-04-29

Qwen3中性能最强MOE模型部署抛砖引玉 + 实测

2025-04-29

体验了最新的Qwen3之后，端侧之王果然没有让我失望！

2025-04-29

Qwen3 重磅开源！

2025-04-29

Qwen3深夜正式开源，小尺寸也能大力出奇迹。

2025-04-29

猛击OpenAI o1、DeepSeek-R1！刚刚，阿里Qwen3登顶全球开源模型王座，深夜爆火

2025-04-29

阿里Qwen3正式发布：最小6亿参数，叫板Gemini-2.5Pro

2025-04-29

阿里 Qwen3 正式发布，一口气开源8款模型！这个五一注定不太平！

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

DeepSeek本地化部署有风险！快来看看你中招了吗？

2025-04-28

AGI｜智能体总忘事？Letta框架如何让AI告别"金鱼记忆"？

2025-04-28

杨植麟再掀 AI 风暴！Kimi-Audio 如何让机器听懂人类 “弦外之音”？

2025-04-28

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部