我要投稿

AGI｜如何在本地运行大型语言模型？

发布日期：2024-07-30 18:24:15 浏览次数： 2321 作者：神州数码云基地

pen WebUI和Ollama介绍

在某AI产品发布会上，我们需要演示在个人PC上运行大模型的能力。为了实现这一目标，我们进行了深入的市场调研和技术评估，最终选择了Open WebUI和Ollama作为演示的核心工具。

作者

张敏 |高级前端开发工程师

Hello World

Part1

介绍

什么是Ollama

Ollama是一个开源的大型语言模型服务工具，它帮助用户简化在本地机器上部署和运行大型语言模型（LLM）的过程。这个框架提供了一套工具和命令，使得用户能够轻松地启动和使用各种流行的LLM，比如qwen，mistral等，更多大模型请参考available models（https://ollama.com/library）。

什么是Open WebUI

Open WebUI 是一个开源项目，为本地大语言模型提供一个图形化界面。Open WebUI 支持各种 LLM 运行器，包括 Ollama 和 OpenAI 兼容的 API。它是一个自托管的 WebUI，可以在完全离线状态下运行，所有数据都存储在本地设备上。

Ollama + Open WebUI组合，支持在个人PC上运行LLM，并且通过Open WebUI图形化界面使得用户能更方便的调用Ollama提供的LLM能力，完美的契合了演示需求。

Part2

部署

环境：windows 11

Ollama部署

在我写这篇文章的时候，Ollama已经发布了Windows版本，直接去官网下载对应版本的安装包就好了, Ollama下载（https://ollama.com/download）。

下载之后文件如下图，双击.exe文件，傻瓜式安装就好了。

安装好之后运行你想要的大模型，比如我想运行 qwen0.5b，可以执行以下命令：

ollama run qwen:0.5b

更多模型可以进到对应模型详情页下，如下图，左侧下拉框选择你想要的模型，执行右侧命令即可。

Open WebUI部署

有编程经验的，感兴趣可以去Github下载源码本地部署调试，这里介绍Docker部署。

编程小白在部署Open WebUI之前可以下载Docker Desktop（https://www.docker.com/products/docker-desktop/），下载之后傻瓜式安装。

Docker安装好之后拉取Open WebUI镜像，执行以下命令，这个过程比较长，耐心等待就好。

docker pull ghcr.io/open-webui/open-webui:main

启动Open WebUI容器，执行以下命令：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

启动成功，浏览器访问 http://localhost:3000/，首次注册的用户为系统管理员，登录之后页面如下图，开始聊天之前选择想要的模型，就可以开始和大模型对话了。

来一段简易的对话：

可以看到，对话不仅支持普通的文本信息，还支持文件，大模型根据指定的文件做出分析回答。除此之外，在Workspace页，可以添加提示词(Prompt)，在聊天界面通过@，#等命令引用对应的文档，提示词，让用户可以更高效的和大模型沟通。

至此，我们已经在本机上搭建起了一套大模型环境，即使在离线情况下也不影响使用。数据都存储在本地，也不用担心安全问题。

Part3

代码展示

关于离线和数据安全这部分，展示一下相关代码：

我们没有做额外的环境变量配置，所以这里的路径都是默认的路径，DATABASE_URL (数据库地址)指向的就是应用程序代码下的data目录。

系统会通过上面的DATABASE_URL路径创建数据库，并执行apps/web/internal/migrations下的脚本创建数据库结构等。

再看应用程序对应的文件，相应目录下确实存在webiu.db文件，存的是交互的数据，包含聊天记录，授权信息等，前面演示聊天上传的文件也在另外一个目录下。证明我们的数据信息都是保存在本机上，不会存在信息泄露的问题。

可以看到，系统会根据选择的模型得到Ollama服务的地址，再向其发送聊天请求，得到大模型的回答之后再返回给客户端。因为我们的Ollama服务是在本地运行的，所以这个请求最终还是由本机来处理，不涉及到联网请求。我将电脑网络断掉，仍然可以正常收到回答就更直观的验证了这一点。

有了客户端源码，也有了Ollama提供的本地大模型服务，我们可以根据自己需求对Open WebUI进行重新设计改造，保证了发布会顺利进行。

在本地集成AI（AI PC）目前不仅是一个概念，已有公司发布了相关产品，为用户带来了许多新的体验和便利。未来，我们的个人电脑就是一个强大的人工智能，为我们的学习办公提供更高效智能的帮助。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

Spring AI Alibaba搭建机票助手(实战篇)

2025-04-26

我在通用Agent上的探索设计初稿

2025-04-26

Ollama-Deep-Researcher-本地Mac结合魔搭社区模型搭建网页研究助手

2025-04-25

Manus开源版本！无需邀请码，老金手把手教你咋用！

2025-04-25

78k star，像写 Markdown 一样画流程图，这个开源工具太牛了！

2025-04-25

MarkItDown MCP：一款好用的将文件和办公文档转换为Markdown的AI工具！

2025-04-24

AI+SQL客户端，这款开源神器让数据库管理像聊天一样简单！

2025-04-24

效率革命！GitHub爆火的开源神器MinerU：PDF、网页、电子书一键转Markdown

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部