我要投稿

教程｜挑战 DeepSeek 671B？在 MacBook 本地部署 QwQ 32B 模型

发布日期：2025-03-22 07:30:12 浏览次数： 1665 作者：東雲研究院

阿里最近放了个大招，相当大。

他们刚开源了一个叫做 QwQ-32B 的推理模型，一个参数仅 320 亿的模型，在各项能力测试中居然达到了 6710 亿参数的满血版 DeepSeek R1 的水平。

下图是和满血 R1（671B）、o1-mini、70B R1 以及 32B R1 的对比，可以看出这个颜文字模型 QwQ 32B 的能力已经和满血 R1 相当了。

QwQ 这么厉害的诀窍在于使用了大规模的强化学习（RL）。

啥子是强化学习？

想象你是一个第一次学做菜的新手，厨房是环境，你的目标是炒出最好吃的菜。

每次你尝试不同的调料搭配（动作），尝一口后根据味道（奖励）调整下次放多少盐或糖。一开始可能太咸或太淡（试错），但通过反复调整，最终找到最佳配方（最优策略）。

强化学习就像这个过程：通过行动的结果反馈，不断优化选择，直到达成目标。

模型就是在这样一个不断折腾和反馈的过程中反复迭代，最终炼制成功，得道成仙。

仅 DeepSeek 二十分之一的参数，这样的参数规模，可以部署在配置稍微好点的个人电脑上，而满血的 DeepSeek R1，你没个 400G 内存应该是跑不下来……

qwq是什么意思qwq表达什么含义_法库传媒网

好，下面我就来尝试在 MacBook 本地部署一下QwQ。现在有了各种方便的工具，比如 Ollama、Cherry Studio 等等，折腾起来也非常简单。

当然，本地部署的优势在于隐私保护和本地知识库，另外就是一个主打折腾的 Geek 精神。

如果你没有这些需求，使用免费的 DeepSeek、元宝客户端，或者调用廉价的 API，都比本地部署要省心和划算。

一、安装 Ollama

Ollama 是一个可以在本地运行大语言模型（LLM）的命令行工具，如果你之前安装过，部署过其他模型，那就可以跳过这一步。

首先进入 Ollama 的官网：

https://ollama.com/

点击神兽图标下方的「Download」，去下载 macOS 版本。

国内网络用浏览器直接下载可能会比较慢，你可以把下载链接复制到迅雷里下载，速度很快。

下好后解压缩，先把这个神兽图标拖到「应用程序」里。

然后，打开 Ollama，点中央的 Install，这时候需要输入 Mac 的解锁密码。

出现下面这样的提示就说明装好了。

二、下载并执行模型

打开「终端」，输入这个命令：

ollama run qwq

然后就开始下载模型了，大概 19G 多一些，网速快的话很快就好。

如果你看到 Success 的提示，就说明模型下载成功了，随后模型会自动加载并运行，会看到三个尖括号：「>>>」，这样就表明可以和模型聊天了。

我们随便发句话试试：

它做出了思考并回复了我，很好，模型已经运行成功。

当然，在命令行里聊天的体验非常糟糕，也不能保存记录，所以我们要给它搭配一个聊天 UI，请看下一步。

三、搭配 Cherry Studio 使用

Cherry Studio 是一个 AI 对话客户端，支持各种服务商的 API 或者本地模型的接入，还支持本地知识库（RAG），功能很全面。

它和 Chatbox、ChatX 一样，都是 AI 聊天客户端，你可以选一个自己习惯的来用。

我最近换了 Cherry Studio，体验不错，所以下面就以 Cherry Studio 为例来进行说明。

首先到官网下载它：

https://cherry-ai.com/

安装好后，进入设置界面，找到「模型服务」，找到「Ollama」。

在右边的窗口里，检查「API 地址」是否正确，一般就是默认的本地 11434 端口，密钥不用填，如下图所示：

然后点最下方的「添加」，增加qwq:latest模型，并在更多设置中勾选「推理」。

保存之后，确认一下 Ollama 旁的开关已打开，这样就 OK 了。

回到 Cherry Studio 的聊天窗口，点击聊天窗口上方，选择我们刚创建好的模型，就可以开始和本地的 QwQ 聊天了。

四、随便玩玩

现在我就让它和我本地的 32B DeepSeek R1 （部署参考：手把手｜在MacBook本地部署DeepSeek R1是一种什么体验？）对比一下，看看它俩谁厉害。

出个小作文题目吧：

以“一个发现时间可以倒流，但每次只能倒退5秒的普通人”为主角，写一个300字的故事，需包含冲突和转折。

先来看看 32B R1，它思考了 34 秒，给出了这个故事：

再来看看 QwQ 32B，它思考的时间翻了一倍，达到 76 秒。来看看它的作品：

好家伙，QwQ 写的有深度多了，同是 320 亿参数，QwQ 表现亮眼不少。

另外，在我的 M4 Pro 的 MacBook 上，32B R1 的输出速度 14token/s，而 QwQ 32B 是 16token/s，略快一些。

好，就写到这里，各位可以回家去折腾自己的电脑了。

END

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-16

吩咐 AI 帮我一键运行万星 Github 项目

2025-04-16

A2A协议：打破Agent“孤岛”，开启智能协作新时代

2025-04-16

GitMCP: 让AI助手拥抱开源世界的桥梁

2025-04-16

解放双手！Index：顶尖开源AI浏览器代理，复杂网页任务一键搞定 (Claude 3.7 驱动)

2025-04-16

CortexON：开源通用AI Agent，又一替代Manus产品

2025-04-16

AI涌现人类情感！希腊「乐之神」Orpheus开源，单卡可跑语音流式推理

2025-04-16

Second Me 重磅升级：全平台 Docker 支持，Mac/Windows/Linux 全覆盖！

2025-04-15

Spring AI 1.0.0 M7 发布！很炸裂！！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

为什么大模型本地部署后“没了下文”？

2025-04-03

阿里搞了个大新闻！这AI能听会看还会实时唠嗑，科幻片都不敢这么拍？

2025-04-03

Agent框架大比拼：谁将引领智能应用的未来？

2025-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB