我要投稿

本地部署大语言模型指南

发布日期：2025-04-13 05:12:47 浏览次数： 1553 作者：一个杠精的自我修养

这里选用Ollama+QwQ32b作为本地大模型运行的基础，如果没有并发需求可以选用LM Studio，支持m系列芯片的MLX框架，生成token速度比Ollama快50%，但缺点是不支持并发。

本文以Mac OS部署Ollama+QwQ32B为例：

一、安装 Ollama

1. 官网下载安装

访问 Ollama 官网，下载 macOS 版本安装包。安装时需将应用拖入「应用程序」文件夹，并输入系统密码完成安装。

2. 验证安装

打开终端输入以下命令，若显示版本号（如 0.6.3 ），则安装成功：

ollama --version

二、本地运行 QwQ-32B 模型

1. 下载模型

在终端输入以下命令，模型文件约 19GB，需等待下载完成：

ollama run qwq

技术说明：

默认下载的版本是经过量化的Q4版本，量化简单理解就是将高精度模型参数转换为低精度（如 16 位浮点转 4 位整数），以减少计算资源消耗并保持模型性能的技术，性能损失约10%左右。实测如采用Q6量化，内存占用将显著增加。

2. 验证与交互

下载完成后，终端会进入交互模式（显示 >>> ），可直接输入文本测试模型响应：

三、拓展OLLAMA上下文

1. 配置步骤

echo 'export OLLAMA_CONTEXT_LENGTH=16384' >> ~/.zshrc
# 永久生效配置（写入 shell 配置文件）
source ~/.zshrcollama serve
# 重启终端并应用配置

2. 验证配置

echo $OLLAMA_CONTEXT_LENGTH
# 检查环境变量是否生效（需提前设置）
# 返回空值时使用默认值2048
# 成功设置示例输出：16384

3. 注意事项

环境变量优先级高于模型默认配置
同时存在 Modelfile 的 num_ctx 和环境变量时以后者为准
拓展上下文会显著增加内存占用

四、dify调用本地模型

设置路径：

1，Dify-插件-安装Ollama

2，插件设置-模型供应商-添加模型

五、安全问题

风险提示：Ollama 默认开放 11434 端口且无身份验证，攻击者可直接访问服务窃取数据或执行恶意操作。

防护建议：

修改配置限制端口访问范围（如绑定 127.0.0.1）
启用 API 密钥或 IP 白名单认证
及时更新至安全版本（如 0.1.47+）

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-14

DeepSeek|手把手教你完成AI投喂数据训练

2025-04-14

大模型量化方式详解及建议

2025-04-14

驯服AI的艺术：参数调整完全手册

2025-04-13

Ollama部署大模型以及配置外部访问

2025-04-13

企业私有化 LLM 应用开发路径：从技术跟风到业务驱动

2025-04-13

深入浅出大模型：大模型预训练、后训练、微调

2025-04-13

Cursor最新版本0.48太炸裂了

2025-04-12

什么是蒸馏技术

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

FP8 低精度训练：Transformer Engine 简析

2024-07-11

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

大家都在问

RAGFlow vs Dify, 商业化落地场景选哪个？

2025-04-01

如何利用Dify轻松构建你的专属语料库？

2025-03-31

从 0 到 1，Agentic Ops 如何打造企业级 AI 生产力？

2025-03-20

DeepSeek-R1的Qwen-32B蒸馏模型与QwQ-32B模型，谁更强？

2025-03-16

部署DeepSeek的4条路，企业级客户到底该咋走？

2025-03-16

谷歌Gemma 3 27b 到底能不能打，写个游戏测试下？

2025-03-13

强化学习(RL)是什么? 它和微调有什么区别?

2025-03-13

从DeepSeek到Manus：如何实现本地LLM微调+联网开发？

2025-03-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB