我要投稿

挑战用不到2000块钱的主机本地部署运行llama3-70b

发布日期：2024-04-26 07:49:19 浏览次数： 4192 作者：腾哥聊产品

大家好，今天我们来挑战一下，能不能用2000块钱的电脑跑llama3-70B大模型。

年初的时候，我配置了一台不到2000块钱的AI主机。《花了不到2000元，撸了一台AI主机，本地部署大模型》

我们来看看这个主机配置。（后面升级了内存和硬盘,总计2000多一点）

配置	商品	价格
主板+CPU	精粤X99-D3大板 +拆机至强E2666 V3	368
风扇	全新四铜管散热	33
内存	拆机三星服务器内存DDR3 32G * 2	170
硬盘	全新海康威视1T SSD NVME协议	378
电源	拆机台达750W电源	212
显卡	拆机NVIDIA TESLA P40 24G显存	824
显卡风扇	全新改装风扇	55
亮机显卡	拆机AMD HD3850 1G（带HDMI)	42
机箱	全新随便挑的机箱	49
	总计	2131

显卡用的是Tesla P40 24G显存的显卡，还有64G内存。

现在发现这张显卡已经涨了一倍了，而且全网断货。差不多配置的主机整机，卖到近3000块钱。

那我们今天来看看，这个主机能不能跑得起llama3-70b大模型。

我用的模型部署工具是ollama，我们可以在ollama官网上下载llama3:70b大模型。

这里我已经下载好了。

我们看看现在主机资源消耗。

还可以在cmd命令行里输入nvidia-smi，看看显卡的使用情况。

现在我们运行 ollama run llama3:70b，提问：who are you

真的是可以运行的，但是有点慢，大概每秒只能生成一个token。

看看这个时候的资源使用率，显存基本用满了，内存也用了30多G。

慢的原因是一方面是模型参数量比较大，本身的推理速度就会比较慢，另外由于显存不够用，把一部份参数放在内存里了，要用的时候呢，再把内存里的参数调出来，这里面要不断地传输交换数据。

据说mac电脑用的统一内存架构，内存显存全部共享容量。如果内存够的话，能够流畅地运行70b大模型。我没有这么高配的mac，如果有尝试成功的朋友，可以分享一下。

llama3-70b大模型，虽然在中文的表现上还不是很好，但是在数学、推理、代码生成等方面能力还是很不错的。

用70b模型微调后，用在代码生成、Agent规划、工具调用这些对中文理解要求不是特别高的场景非常适合。

现在国内很多云平台，已经推出了llama3的开发者环境，企业、开发者都可以很轻松地做微调。大家有什么想法，评论区交流。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

一文了解：大模型 Agent 开发框架有哪些？它们的区别是什么？

2025-04-27

为什么新手比专家更想做垂直领域SFT微调？

2025-04-27

伪装成浏览器的 AI Agent，好用吗？

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部