我要投稿

本地部署671B参数版DeepSeek R1模型

发布日期：2025-02-18 08:27:22 浏览次数： 2046 作者：小眼睛的AI世界

DeepSeek-R1的开源策略和低成本高性能优势，使其迅速成为全球AI领域的焦点。从国内企业到国际巨头，众多公司纷纷接入并应用该模型，推动了AI技术在多个行业的落地与创新。

01

DeepSeek R1：一场AI革命的崛起，创新与成本双双爆表！

在当今这个技术飞速发展的时代，DeepSeek R1凭借其独特的创新技术和极具吸引力的成本效益，引发了全世界的广泛关注。

首先，得聊聊DeepSeek R1的技术与性能。这款模型采用了前沿的架构和增强的注意力机制，信息处理和推理能力都能让人刮目相看。尤其是在数学和代码生成领域，它的准确性可以与OpenAI的顶尖产品不相上下，简直是个难得的“狠角色”！

另外，不得不提的还有它的成本效益。这款模型在AI开发和部署中简直是个“经济适用男”，预训练的价格远低于其他老牌模型，而且API服务的定价也超级有竞争力，令许多企业心动不已。

自从DeepSeek R1面世以来，它的亮眼表现和开源策略吸引了不少目光，已经有多个国际大佬和国内知名企业纷纷插上了这颗“科技明星”的翅膀。比如，华为云、腾讯云、阿里云、百度智能云等国内知名云平台都表示已对DeepSeek R1进行了强力支持，推动国产GPU与之完美适配，让AI技术更深入民心。

不仅如此，英伟达、微软、亚马逊这样的国际科技巨头也没有闲着，它们迅速搭建起与DeepSeek R1的连接，推出基于该模型的多款产品或服务，力图在这场AI浪潮中抢占先机。

02

想体验DeepSeek R1？这里教你两种本地部署方法，轻松上手！

DeepSeek R1火得一塌糊涂，难免让人心动，不如自己来试试？有两个方法可以让你在家也感受到这款671B参数版模型的魅力，快来看看吧！

方法一：本地算力部署

DeepSeek R1的6710亿参数可不是开玩笑的，硬件要求那是相当高的。如果你想亲自部署这个大佬，建议考虑以下配置：

内存和显存：最好有200GB以上的内存和显存总和，别想轻松过关。
存储：由于模型文件庞大，强烈推荐使用至少2TB的高速SSD存储，这样读取速度才不会拖后腿。
处理器（CPU）：一颗强大的多核CPU是必不可少的，比如Intel Xeon或者AMD EPYC系列，可以满足这些庞大计算的需求。
图形处理单元（GPU）：你至少需要一块NVIDIA A100 Tensor Core GPU（40GB显存），如果能多张GPU卡加持，那推理速度就更棒啦！

不过得提醒你一点，完整的671B MoE模型文件足足占用了720GB的空间，对于大部分人来说，这可是一道高门槛。为了降低部署难度，采用量化技术是个不错的选择，通过动态量化技术将模型体积压缩到最小131GB。

举个我个人的例子，我的电脑配置是64GB内存加上英伟达4090显卡，尝试本地部署量化后的R1全参数模型。

首先，ollama官网下载了Ollama工具，

然后在命令行输入：

ollama run SIGJNF/deepseek-r1-671b-1.58bit。

可是，由于我的内存不够大，我还得设置虚拟内存。

验证效果的时候，虽然可以运行出结果，但生成速度简直慢到让我怀疑人生，基本无法正常使用。

因此对于大多数个人用户来说，建议选择本地安装蒸馏后的轻量化模型，具体参数大小可以按需选，

记住：参数越多，模型就越“聪明”哦。

方法二：调用服务商算力部署

如果你的本地硬件实在太捉襟见肘，不妨试试通过API调用来体验这款满血版R1模型。你只需先申请DeepSeek R1的API，访问这两个链接之一：

官方网址：https://platform.deepseek.com/api_keys
硅基流动：https://cloud.siliconflow.cn/i/NJ5dwxwX

申请到API Key后，记得在你常用的浏览器（谷歌或火狐）中添加插件Page Assist。

安装插件后，在右上角点击“设置”，输入你的API Key和设置语言。

最后，别忘了在左上角选择想要使用的模型DeepSeek V3或R1，这样就可以开始你的DeepSeek R1之旅了！

快来动手试试吧！希望你能在这个体验中找到乐趣与灵感！如果有什么问题或者心得，随时分享哦！

总而言之

DeepSeek R1凭借着开源与低成本高性能的优势，迅速成为全球AI领域的焦点。随着越来越多的公司和开发者加入这场AI革命，DeepSeek的影响力势必将进一步扩大，期待它在未来带给我们的更多惊喜！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-24

Suna：构建你专属“通用智能体”的开源利器

2025-04-24

开源TTS领域迎来重磅新星！Dia-1.6B：超逼真对话生成，开源2天斩获6.5K Star！

2025-04-24

仅用3周时间，就打造出Manus开源平替！贡献源代码，免费用

2025-04-23

只需6G显存，就能本地跑的AI视频算法，开源了！

2025-04-23

OpenAI Codex 使用OpenRouter上的免费模型

2025-04-23

又一个牛皮的开源的通用型智能体界面和Manus有99分相似

2025-04-23

从零到多智能体：Google Agent开发套件（ADK）入门指南

2025-04-23

超强辅助，Bolt.diy 一步搞定创意建站

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

万字详解DeepSeek-R1，引爆AI圈的又一力作，大模型爆发势不可挡！

2025-01-21

太强了！10大开源大模型！

2024-05-06

QWEN2.5开源上新，14B/32B回归实测：这就是最强单卡本地模型！

2024-09-20

全民进入GPT-4时代：OpenAI强势推出GPT-4o mini！彻底取代GPT-3.5！

2024-07-20

如何免费使用 Claude AI？Claude使用指南！

2024-07-11

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

DeepSeek-V3 正式发布

2024-12-26

大家都在问

AI大模型火热，将 Hugging Face大模型转换为 GGUF 为何受关注？

2025-04-21

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

OpenAI开源的Codex CLI是什么？

2025-04-17

MCP，这个AI 开源协议有多大想象空间？

2025-04-15

Google ADK，知多少？

2025-04-13

一文看懂谷歌 A2A：它到底是个啥？为什么能带AI Agent 组队开黑？

2025-04-10

实测Llama 4，究竟是王者归来，还是廉颇老矣？

2025-04-07

4天开发，1700万美元融资：开源的Browser Use为啥这么火？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部