我要投稿

谷歌开源Gemma，本地部署指南！

发布日期：2024-04-10 21:12:43 浏览次数： 2973 作者：原子社

在开始使用Gemma开源大语言模型（LLM）前，我们先了解下Gemma以及配套的工具。

基本介绍

Gemma 是由 Google 推出的一系列轻量级、最先进的开放模型。这些模型基于与 Gemini 模型相同的研究和技术构建，由 Google DeepMind 和 Google 内部其他团队共同开发。Gemma 的名字来源于拉丁语 "gemma"，意为“珍贵的石头”，象征着其在 AI 领域的重要价值。

这次发布的Gemma不仅仅只有2B 和 7B这两种规模，实际上是发布了Gemma系列（经过预训练的变体和指令优化的变体，大大小小50多种），Gemma 模型非常适合各种文本生成任务，包括问答、总结和推理。

同时，还能在Keras3.0（以集成主要框架JAX、PyTorch和TensorFlow）上用于推理和监督微调（SFT）的工具链。以及提供了谷歌Colab和Kaggle笔记本快速部署代码和HuggingFace等第三方AI平台的集成，使用户能快速上手体验。

第三方体验地址我会放在文尾。

基础性能

这次开源的Gemma和Gemini用的是同样的技术和基础组件，谷歌自信地认为Gemini是他们目前发布以来最强大、功能做广泛的大语言模型。Gemma7B在基准测试上明显超过了Llama-2 7B和13B，无论是科目问答，推理性能，数学能力还是代码能力都要比Llama-2强太多（这里的数据是基于关键基准上测试的）。

论文内的性能如下图：

好了，以上就是Gemma的简单介绍，有兴趣的小伙伴可以看下原文：

传送门：https://blog.google/technology/developers/gemma-open-models/

快速上手

在安装前先确定C盘目录大于20G，再根据自己的电脑配置安装不同型号的Gemma，8G显卡跑2b应该问题不大，16G以上的跑7b也没问题。

这次使用Gemma，我们还是用LLM的老朋友开源的Ollama项目。我们先进入Ollama的主页（地址在文尾）。

进入主页后，点击下载按钮，进入下载页。

总共有macOS、Linux和Windows三个版本，根据您的系统，选择一个版本下载，这次我们以windows为例。

下载完成后就是这个可爱的羊驼图标，然后我们双击OllamaSetup.exe安装，默认情况下是装在C盘的，直接点install一键安装。

安装完成后，系统任务栏右下角位置会多出一个草泥马的头像，这代表已经完成安装了。接下来，我们打开windows自带的powershell待命（在windows搜索栏搜powershell）。

接下来，我们再回到ollama官网的模型页面，在模型列表处找到Gemma，点进去。

进去之后Overview是模型概述，不管它，直接点Tags，茫茫多的型号该怎么选呢。

以下是Gemma的版本和型号参考：

2b 和 7b：表示模型的参数数量，分别是2亿和7亿参数。
instruct：表示模型是针对特定指令或任务进行训练的。
text：表示模型专注于处理文本数据。
fp16：表示模型支持半精度浮点数（16位浮点数），这有助于在保持相对较高精度的同时减少内存使用和提高计算效率。

每个型号后面的q4_0、q4_1等是模型的不同版本，是基于模型性能、训练数据集、优化策略或其他因素的不同迭代。例如，q4_0是第四个迭代的初始版本，而q4_1可能是在q4_0基础上的改进版本。

那么我们选latest这个版本，也就是最新版。

直接在powershell里输入命令ollama run gemma开始下载，下载无需魔法不过可能会花点时间。

下载完成后，在send a message行里就可以直接与gemma对话了。

tips：

1. 运行不同版本的gemma，示例：

ollama run gemma:2bollama run gemma:7b

2. gemma默认下载在C盘；

3. 按Ctrl+D退出gemma；

4. run ollama gemma启动gemma；

5. ollama list查看模型型号列表.

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

OlmOCR如何成为搭建RAG 知识库的"智能中枢"？

2025-04-11

谁是MCP 的 AI 好搭档？

2025-04-11

为什么提示工程，可以驾驭大模型？

2025-04-11

经验分享：从买DeepSeek一体机到落地应用场景，有多远的距离？

2025-04-11

大模型如何保证输出json格式？

2025-04-11

阿里百炼MCP一键部署简单到颠覆想象！字节Coze会否闪电跟进？

2025-04-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB