我要投稿

使用腾讯 HAI 5 分钟内部署一个私人定制的 DeepSeek

发布日期：2025-02-05 08:11:38 浏览次数： 2381 作者：汪子熙

过年期间，因为众所周知的原因，DeepSeek 受到了居心叵测的攻击。在这篇文章写作之时，DeepSeek API 控制台仍然没有恢复访问。

近期在笔者实际使用过程中，也经常遇到 DeepSeek 没能按照期望生成任何有意义的回复，或者服务器繁忙的情况。

我们知道 DeepSeek 是一个开源的大模型，其开源特性最直观体现在其完整公开的模型架构设计。

与闭源模型的黑箱特性形成鲜明对比，DeepSeek GitHub 仓库中不仅包含模型权重文件，更完整披露了 transformer 架构的具体实现细节：

https://github.com/deepseek-ai/DeepSeek-R1

项目公开的 data_curation 模块也展示了从原始网页数据到高质量训练数据的完整处理流程。

这一切使得 DeepSeek 模型非常易于部署在本地电脑或者一切主流的云上。

以腾讯 HAI 为例，让 DeepSeek R1 模型部署并运行在腾讯 HAI 上，整个流程不超过 5 分钟。

腾讯 HAI，全称 Hyper Application Inventor，高性能应用服务，是一款面向 AI 、科学计算的 GPU 应用服务产品，提供即插即用的澎湃算力与常见环境。

HAI 的访问入口：

https://cloud.tencent.com/product/hai

点击立即使用：

新建算力资源：

在算力资源列表，选择「社区应用」，排名第一的就是 DeepSeek-R1：

算力资源选择最基础的「GPU 基础型」即可，这种规格的算力为 8+ TFlops SP，其中 Flops 是 Floating Point Operations Per Second 的缩写，它表示计算机每秒可以执行的浮点运算次数。

T 代表 10 的12次方即一万亿，8TFlops 即每秒 8 万亿次浮点运算，SP 即 Single Precision，单精度运算，代表计算机使用 32-bit（4 字节）的浮点数进行计算。

算力资源只需要两三分钟即可自动创建完毕。

创建好的实例中，预置了分别以 Web 浏览器方式和终端命令行方式访问 DeepSeek R1 模型的「ChatbotUI」和「JupyterLab」.

ChatbotUI 即 Chatbot Ollama，一个开源的聊天用户界面，专门为 Ollama 模型设计，基于 chatbot-ui 项目。

它旨在为用户提供一个简洁、高效的交互平台，以便更好地与 Ollama 管理的模型进行交互。

Ollama 是一个开源框架，专门设计用于在本地运行大型语言模型，其主要特点是将模型权重、配置和数据捆绑到一个包中，从而优化了设置和配置细节，包括 GPU 使用情况，简化了在本地运行大型模型的过程。

腾讯 HAI 将 Ollama 安装和配置工作为用户全部隐藏起来，只需在上图展示的 HAI 算力资源创建页面新建算力，就能立即得到「开箱即用」的 DeepSeek R1 模型应用。

点击「ChatbotUI」，会自动打开一个浏览器窗口，我们就可以在这个窗口里，同腾讯 HAI 上部署好的 DeepSeek 进行交谈了。

Ollama Model 下拉菜单里，可以选择预置的 1.5b 或者 7b 模型。

b 即 billion，1.5b 代表模型参数为 15 亿个，7b 则代表 70 亿个模型参数。

7b 模型由于拥有更多的参数，能够捕捉到更复杂的特征，因此在处理复杂任务时，通常比 1.5B 模型表现更优异。比如在需要深度理解和推理的任务中，7b 模型可以提供更准确详细的回答。

另一方面由于参数数量的增加，7b 模型对硬件配置的要求更高，在运行时需要更多的计算资源。根据 Ollama 官方提供的信息，7B 模型的大小约为 4.68 GB，而 1.5B 模型约为 1.1 GB.

当然，因为我们使用了腾讯云端的 HAI，使用这些模型，不会给本地电脑浏览器端产生任何额外的负载。

在这个浏览器窗口里，可以通过滑动条对 DeepSeek 的 Temperature(温度)参数进行调整。Temperature 越低，模型的输出越确定，生成的文本更加保守和可预测。反之，较高的 Temperature 会使输出更加随机、多样化，但也可能导致回答的质量下降。

用一些稍稍复杂一些的题目来测试：

请你扮演一位资深的数学家，一个楼梯共有八级台阶，规定每步可以迈一级台阶或者两级台阶，最多可以迈三级台阶。从地面到最上面一级台阶，一共有多少种不同的迈法？请你给出详细的分析和解答思路。

DeepSeek 给出了令人满意的回答：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-26

Ollama-Deep-Researcher-本地Mac结合魔搭社区模型搭建网页研究助手

2025-04-25

Manus开源版本！无需邀请码，老金手把手教你咋用！

2025-04-25

78k star，像写 Markdown 一样画流程图，这个开源工具太牛了！

2025-04-25

MarkItDown MCP：一款好用的将文件和办公文档转换为Markdown的AI工具！

2025-04-24

AI+SQL客户端，这款开源神器让数据库管理像聊天一样简单！

2025-04-24

效率革命！GitHub爆火的开源神器MinerU：PDF、网页、电子书一键转Markdown

2025-04-24

Suna：构建你专属“通用智能体”的开源利器

2025-04-24

开源TTS领域迎来重磅新星！Dia-1.6B：超逼真对话生成，开源2天斩获6.5K Star！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB