我要投稿

部署DeepSeek，你的GPU够用吗？

发布日期：2025-02-12 18:06:18 浏览次数： 2562 作者：阿里云开发者

引言

随着DeepSeek的热度不断攀升，关于如何复现或部署DeepSeek的文章层出不穷。无论是直接在官网使用，还是通过三方平台调用，无论是API接入亦或是本地及云端部署，归根结底还是在根据具体的情况从性能、费用和安全性的不可能三角中寻找平衡。

对大多数普通用户来说，第三方平台提供的网页、客户端和 API 服务可能是最便捷的选择。例如，阿里云推出的百炼API调用，具体教程可参考历史文章，这些服务不仅易于上手，还能提供稳定的支持和维护，确保用户体验的流畅性。

?100万免费 Token！DeepSeek-R1满血版即刻拥有

对于那些希望进一步自主部署但资源有限，并且需要推理加速和支持并发的用户，更便捷的云上一键部署方案是理想选择。这种方案开箱即用，具备弹性可伸缩和充足的算力优势，允许用户基于私有数据进行模型微调和参数调整，以适配垂直领域的需求。

?阿里云PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型

基于函数计算部署 DeepSeek 模型，支持 Ollama/Transformers 等框架，并能构建多样化的模型对话界面，如 OpenWebui 和 ChatGPTNext。对于技术爱好者，试图做出更多尝试并且期望获得完全自主可控大模型的用户，使用 GPU 部署可以根据需求自定义环境配置，例如安装特定版本的 CUDA 和深度学习框架等。

?0代码！2种方式一键部署 DeepSeek 系列模型

GPU 服务器提供了强大的计算能力，适用于深度学习、科学计算、图形可视化和视频处理等多种应用场景。云端部署的优势：

部署效率与易用性

云端部署无需复杂的环境配置和硬件搭建，简单几步，最快 10 分钟就能快速实现不同尺寸的 DeepSeek 模型部署和应用。

算力需求与成本优化

云端部署提供了弹性、充足的算力支持，同时相比本地部署需要购买和维护昂贵的 GPU 硬件，云端部署按需付费的模式可以显著降低硬件成本。

唾手可得的创新资源

云端部署支持快速迭代和优化，开发者可以利用云平台提供的工具和资源，快速进行模型训练、调优和更新，加速创新。

模型部署

本文介绍如何将 DeepSeek-R1 开源模型部署到 GPU 云服务器，在 GPU 云服务器上安装与配置 Ollama 和 Open WebUI。Ollama 负责托管 DeepSeek-R1 模型，Open WebUI 则为用户提供友好的交互界面。GPU 云服务器凭借其高性能并行计算架构，可以显著加速大模型的推理过程，特别是在处理大规模数据和高并发场景，可以有效提升推理速度和推理吞吐量。专有网络 VPC 和交换机用于资源隔离和安全管理，确保数据传输的安全性和网络的高可靠性。

本文以 DeepSeek-R1-Distill-Qwen-7B 为例进行演示，该版本是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力，通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上，从而在保持高效性能的同时降低了计算成本。用户可以根据实际需求选择其他参数规模的 DeepSeek-R1 模型，并相应调整实例规格配置。

方案架构

按照本方案提供的配置完成部署后，会在阿里云上搭建一个如下图所示的运行环境。实际部署时，您可根据具体的资源规划调整部分配置，但最终的运行环境将与下图展示的架构相似。

环境准备

在开始部署模型之前，需要进行一系列的环境准备工作。这些步骤包括创建专有网络 VPC 和交换机、配置安全组、创建 GPU 云服务器实例。

一、创建专有网络 VPC 和交换机

您需要创建专有网络 VPC 和交换机，为云服务器 ECS 实例构建云上的私有网络。

登录专有网络管理控制台[1]。
在顶部菜单栏，选择华东 1（杭州）地域。
在左侧导航栏，单击专有网络。
在专有网络页面，单击创建专有网络。
在创建专有网络页面，配置 1 个专有网络和 1 台交换机。配置交换机时，请确保交换机所属的可用区的 ECS 处于可用状态。

二、创建安全组

您已经创建了专有网络 VPC 和交换机。接下来您需要创建 1 个安全组，用于限制该专有网络 VPC 下交换机的网络流入和流出。

登录ECS 管理控制台[2]。
在左侧导航栏，选择网络与安全>安全组。
在顶部菜单栏，选择华东 1（杭州）地域。
在安全组页面，单击创建安全组。
在创建安全组页面，创建 1 个安全组。

三、创建 GPU 云服务器

您已经创建好专有网络 VPC 和交换机等资源。接下来您需要创建 1 个 GPU 云服务器实例，用于部署应用程序。

登录ECS 管理控制台[2]。
在左侧导航栏，选择实例与镜像 > 实例。
在顶部菜单栏，选择华东 1（杭州）地域。
在实例页面，单击创建实例。
下表中未说明的参数，在本方案中可使用默认值。

应用部署

接下来我们使用 Ollama 框架来部署 DeepSeek-R1 模型，使用 Open WebUI 调用模型服务。

一、登录服务器

登录 ECS管理控制台[2]。
在左侧导航栏，选择实例与镜像>实例。
在顶部菜单栏，选择华东1（杭州）地域。
部署示例应用程序。

在实例页面，找到前面步骤中创建的 ECS 实例，查看IP 地址列，记录公网 IP ，然后在其右侧操作列，单击远程连接。
在远程连接对话框的通过 Workbench 远程连接区域，单击立即登录，然后根据页面提示登录。

输入密码并点击确定按钮，通过 Workbench 远程连接至 ECS 控制台。
如图所示 GPU 驱动尚未完成安装，请等待 10-20 分钟，安装完成后实例将自动重启。

二、部署 Ollama

执行以下命令部署 Ollama 模型服务。

curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/ollama_install.sh|sh

2. 如下图所示，说明 Ollama 部署完成。

执行以下命令拉取模型。

ollama pull deepseek-r1:7b

执行以下命令，运行模型，运行成功后，在键盘上敲击两次回车键。

ollama run deepseek-r1:7b &

三、部署 Open WebUI

执行以下命令部署 Open WebUI 应用。

curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/install.sh|sh

2. 部署完成后，可以看到控制台中输出Installation completed。

应用体验

一、访问示例应用

在浏览器中访问http://<ECS公网IP>:8080，访问 Open WebUI。

说明

请将 <ECS公网IP> 更改为应用部署步骤记录的公网 IP。

二、与模型对话

在文本输入框中可以进行对话交互。输入问题你是谁？或者其他指令后，调用模型服务获得相应的响应。

三、使用 Chatbox 客户端配置 Ollama API 进行对话（可选）

访问 Chatbox 下载地址[5]下载并安装客户端，本方案以 macOS 为例。

运行并配置 Ollama API ，单击设置。

下拉选择模型提供方Ollama API，填写 API 域名 http://<ECS公网IP>:11434，下拉选择模型deepseek-r1:7b，最后单击保存。

在文本输入框中可以进行对话交互。输入问题你是谁？或者其他指令后，调用模型服务获得相应的响应。

完成及清理

清理资源

释放 1 台 GPU 云服务器实例：登录ECS 控制台[2]，在实例页面，找到目标实例，然后在操作列选择>释放，根据界面提示释放实例。
删除 1 个安全组：登录ECS 控制台[2]，在安全组页面，选择目标安全组，然后在操作列单击删除。
释放 1 台交换机：登录专有网络控制台[4]，在交换机页面，找到目标交换机，然后在操作列单击删除，按照界面提示释放实例。
释放 1 个专有网络 VPC：登录专有网络控制台[1]，在专有网络页面，找到目标 VPC，然后在操作列单击删除，按照界面提示释放实例。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-22

6.4K star！轻松搞定专业领域大模型推理，这个知识增强框架绝了！

2025-04-22

mcp-sse-webui可视化实战项目：基于MCP的webui服务，支持连接多个sse服务端（附完整源码）

2025-04-22

008-蹭了个热点，一次对内部普通人的DeepSeek培训课

2025-04-22

大模型部署框架Ollama和vLLM怎么选？一文讲透两大框架的优缺点和适用场景

2025-04-22

爬虫新宠Crawlee：解锁数据抓取与自动化的超能力

2025-04-21

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

82.9K star！全平台AI助手神器，一键部署轻松搞定！

2025-04-21

微软又整活！MarkItDown-MCP：网页/文件一键转Markdown，还能直接喂给AI用！（支持Claude)

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB