微信扫码
添加专属顾问
我要投稿
低成本主机也能玩转AI大模型,谷歌Gemma3开源,一体机厂家要颤抖了!核心内容: 1. 谷歌Gemma3大模型开源,支持多模态128k上下文 2. 2100元主机成功部署Gemma3-27B大模型,性能惊人 3. 内存不足导致死机,作者巧妙解决继续探索大模型的奥秘
大家好,我就是九歌AI。一个会写代码的产品经理。
今天我又手痒了,看到一条消息,谷歌直接把Gemma3全家桶都开源了!
在巴黎开发者日上,开源Gemma系模型正式迭代到第三代,原生支持多模态,128k上下文。支持多模态呀!
Gemma 3一共开源了四种参数,1B、4B、12B和27B。最最最关键的是,一块GPU/TPU就能跑模型!!
前几天手痒刚用我的2000元洋垃圾主机装了通义千问QwQ 32B,竟然跑起来了,虽然跟老太太一样慢吞吞的,但是能干活呀!
2000元台式机竟成功本地部署通义千问QwQ-32B推理模型,性能比肩DeepSeek-R1!
再让我这个主机装上Gemma3 ,会有啥不一样呢(心里的算盘在敲打...)?
主机成本明细如下:
2680V4 CPU 80元
x99主板 200元
三线内存条32G 300元
二线固态硬盘500G 260元
不知名机箱 110元
1060显卡 540元
二线电源 360元
散热器 60元
总计:1910元
激动的心,颤抖的手,百闻不如一一试,我打开ollama官网一搜,竟然光速上线了Gemma3!
要啥自行车,直接搞起!下载速度非常快,不到10分钟就下载好了!
ollama run gemma3
竟然没运行起来!!提示版本不对!原来ollama要先升级吗?
升级结束。
等等!我下载的好像是4B版本!
那我们先试试4B版本的推理速度吧!竟然高达58token/s,那如果装27B版本,是不是能跑8token/s ?!
看来太激动了也不好,重新下载27B版本吧,ollama再看看需不需要更新!
经过 4 小时漫长的等待,终于下载完成了。输入提示词!
等了一会没反应!再仔细看,死机了!?
内存条已经满了,32G 太小了!怎么办?就这么放弃了吗?
直接买内存条好像来不及,那样热乎劲就过去了。
我小脑袋一转,一拍大腿,不是还有万能的 xx 吗?为啥不租个差不多配置的洋垃圾,这个搞虚拟机多开的,到处都是!
先是问了已经销量高的,开开心心付完钱,让我实名认证,还要露脸拍视频!我一想,这好家伙,我就租一天电脑,我啥信息也卖了呀!果断拜拜,申请退款 。
深夜 11 点,终于勾搭上一个老板,太敬业了,我都被他感动了。
支付一顿排骨米饭后,我如愿获得了一台跟我配置基本相同,但是内存加到了 64G!主机成本来到了2100元!
下面的安装和部署就比较顺利了。下载大模型还是慢,不过可以挂机载,先去睡觉?。
早晨起床后一看,没运行成功,还是需要升级。这次升级直接重启 ollama 就行。
输入下面熟悉的命令,成功了!速度高达1.85token ....
录了个小视频,大家实际感受下这个速度有多稳定!
2100元主机的效果也就这样了,想体验多模态效果的朋友可以使用2080魔改版22G,我这里只能先浅尝辄止了。
祝大家今天上班有个好心情!
《人人都会做智能体》知识库正在建设中,感兴趣的朋友请点击下方的阅读原文,或者后台输入关键词“知识库”!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-13
治理之智|模型蒸馏无需受法律限制,技术创新不宜过早下结论
2025-03-13
太快了!Open-Sora 2.0 重磅开源!
2025-03-13
手撕开源版Manus智能体
2025-03-13
刚刚,OpenAI 重磅发布 Agent SDK!AI 开发范式彻底颠覆!
2025-03-13
刚刚, 谷歌 gemma3 开源
2025-03-13
喜讯!58同城灵犀大模型正式通过生成式人工智能服务备案
2025-03-13
谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
2025-03-13
谷歌Gemma 3震撼发布:单GPU/TPU秒杀Llama-405B,最强轻量AI来了!
2025-01-01
2024-07-25
2024-05-06
2025-01-21
2024-09-20
2024-07-20
2024-06-12
2024-08-13
2024-07-11
2024-12-26
2025-03-13
2025-03-13
2025-03-08
2025-03-03
2025-03-02
2025-03-01
2025-02-26
2025-02-23