我要投稿

谷歌最新 Gemma 2 模型来了：全新架构、单卡全精度极速推理、中文理解能力挺强！

发布日期：2024-06-28 10:20:50 浏览次数： 3969

作者：AI真好玩

微信搜一搜，关注“AI真好玩”

Google DeepMind 发布了最新的 Gemma 2 大语言模型，该模型包含 9B 和 27B 两种规模，采用全新架构设计，性能和效率在同类产品中处于领先地位。

Google DeepMind 在新设计的架构上构建了 Gemma 2，旨在实现卓越的性能和推理效率。让它脱颖而出的原因如下：

超强性能：Gemma 2 的尺寸为 27B，在其尺寸级别中提供了最佳性能，甚至为尺寸两倍以上的模型提供了有竞争力的替代品。 9B Gemma 2 型号还提供同类领先的性能，优于 Llama 3 8B 和同尺寸类别中的其他开放型号。
高效和成本节省：27B Gemma 2 模型旨在在单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 上以全精度高效运行推理，从而在保持高性能的同时显着降低成本。这使得人工智能部署更加容易访问且经济实惠。
跨硬件的极速推理：Gemma 2 经过优化，可以在各种硬件上以令人难以置信的速度运行，从功能强大的游戏笔记本电脑和高端台式机到基于云的设置。在 Google AI Studio 中以全精度尝试 Gemma 2，通过 CPU 上的 Gemma.cpp 的量化版本解锁本地性能，或者通过 Hugging Face Transformers 在配备 NVIDIA RTX 或 GeForce RTX 的家用计算机上运行。

接下来，我将介绍如何使用 Ollama 在本地运行最新的 Gemma 2 9B 和 Gemma 2 27B 模型。

Ollama 运行 Gemma 2

首先，先确保你电脑已经安装 ollama^[1]，同时升级到最新的 0.1.47 版本。

成功安装 ollama 之后，可以在命令行输入以下命令来运行 Gemma 2 9B（5.5G） 或 Gemma 2 27B（16G） 模型：

ollama run gemma2
# Or
ollama run gemma2:27b

运行该命令后，会自动下载 Gemma 2 9B 或 Gemma 2 27B 模型。如果你的电脑拥有足够的内存，可以使用以下命令安装非量化的版本，即使用高精度的版本，以体验更好效果：

ollama run gemma2:9b-instruct-fp16
# Or
ollama run gemma2:27b-instruct-fp16

除了 ollama 之外，你也可以通过 llama.cpp^[2] 或 gemma.cpp^[3] 来体验 gemma 2。

使用 Gemma 2 9B 大模型

基本聊天

文本翻译

原文：Now we’re officially releasing Gemma 2 to researchers and developers globally. Available in both 9 billion (9B) and 27 billion (27B) parameter sizes, Gemma 2 is higher-performing and more efficient at inference than the first generation, with significant safety advancements built in. In fact, at 27B, it offers competitive alternatives to models more than twice its size, delivering the kind of performance that was only possible with proprietary models as recently as December. And that’s now achievable on a single NVIDIA H100 Tensor Core GPU or TPU host, significantly reducing deployment costs.

译文：我们正式向全球的研究人员和开发者发布了 Gemma 2。Gemma 2 现在提供 90 亿 (9B) 和 270 亿 (27B) 参数两种规模，相较于第一代模型，性能更高，推理效率更高，并且内置了显著的安全改进。实际上，在 27B 参数规模下，它可以与参数规模超过其两倍的模型相媲美，并提供与去年 12 月仅限于专有模型可实现的性能。并且，这一切现在可以在单个 NVIDIA H100 算子核心 GPU 或 TPU 主机上实现，大大降低了部署成本。

写高考作文

新课标I卷

阅读下面的材料，根据要求写作。随着互联网的普及、人工智能的应用，越来越多的问题能很快得到答案。那么，我们的问题是否会越来越少？以上材料引发了你怎样的联想和思考？请写一篇文章。

要求：选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于800字。

生成作文题目

知识的海洋与问题的无限

生成作文内容

互联网的普及和人工智能的应用如同掀起了一股知识洪流，无数问题都能在瞬间找到答案。这令人欣喜若狂，也引发了人们对于未来问题的思考：随着问题答案唾手可得，我们的问题是否会越来越少？

表面上看，这个问题似乎是显而易见的。当我们能轻易查阅百科全书，获得权威解答，自然会减少一些“事无巨细”的询问。然而，问题的本质并非仅仅在于“答案”本身，更在于“探索”的过程，在于“思考”的火花。

知识的海洋浩瀚无垠，而问题如同探险家，带领我们深入海洋深处，探索未知领域。当我们 posed 一个问题，我们实际上是在开启一场思考之旅，在探索知识的边界，在挑战自身的认知局限。

人工智能的强大在于它能快速检索和处理海量信息，为我们提供精准的答案。然而，它无法代替我们思考的过程，无法引导我们深入问题本质，无法激发我们对未知的渴望。

问题是人类进步的动力。它促使我们思考、探索、创新，推动人类文明的不断发展。从古至今，无数伟大的思想家、科学家、艺术家，都是通过提出问题、探索答案，最终开创了属于自己的领域。

例如，牛顿的万有引力定律，源于他对苹果坠落现象的思考；爱因斯坦的相对论，源于他对时间和空间的质疑；而达芬奇的艺术创作，源于他对人体的观察和对美的追求。

这些都是问题引发的思考，最终成就了人类文明的辉煌。

因此，即使在知识唾手可得的时代，问题依然是不可或缺的。我们需要培养批判性思维，学会提出更深层次、更富有意义的问题。

我们可以将问题细化到更具体、更精准的层面，例如，不仅仅是“地球是圆的”，而是“地球的自转和公转是如何影响着我们生活的？”

我们可以将问题与现实生活联系起来，例如，不仅仅是“人工智能是什么”，而是“人工智能如何影响着我们的社会发展？”

我们可以将问题与个人价值观和人生目标相结合，例如，不仅仅是“我应该做什么”，而是“我想要过什么样的生活？”

当我们学会提出更深层次、更富有意义的问题，我们就能在知识的海洋中游刃有余，不断探索、不断成长，最终找到属于自己的方向。

互联网和人工智能是工具，而问题是动力。让我们用智慧去引导工具，用思考去点燃火花，让问题成为我们前进的道路，让知识的海洋成为我们探索的乐园。

LangChain

from langchain_community.llms import Ollama
llm = Ollama(model="gemma2")
llm.invoke("Why is the sky blue?")

LlamaIndex

from llama_index.llms.ollama import Ollama
llm = Ollama(model="gemma2")
llm.complete("Why is the sky blue?")

https://ollama.com/library/gemma2

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-04

从Rax+DX到React，一次跨端组件重写的AI提效探索

2025-07-04

豆包又在偷偷进步！超能创意2.0内测，语意理解能力追平FLUX Kontext

2025-07-04

用cherry studio+mcp访问本地数据库

2025-07-04

Cursor 1.2 版本重磅发布：新增TodoList、消息队列、搜索PR、Tab补全提速！

2025-07-04

AI狂潮下：大公司如何破解"创新者窘境"？

2025-07-04

一文了解智能体协议 MCP . A2A . ANP . AGORA

2025-07-04

SAP AI Agent 开发工作台初体验

2025-07-03

Anthropic多智能体如何破解企业级任务并行处理瓶颈？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

比 R1 快 8 倍、价格仅 3%，智谱新推理模型来袭，能让免费智能体自己赚钱！张鹏：Agent 也有 Scaling Law

2025-04-06

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

豆包，让有独立显卡的电脑都能部署本地大模型，语料库就是电脑里的文件

2025-04-17

大家都在问

AI狂潮下：大公司如何破解"创新者窘境"？

2025-07-04

Anthropic多智能体如何破解企业级任务并行处理瓶颈？

2025-07-03

AI 商业化，Salesforce 做对了什么？

2025-07-03

AI 编程如何在团队中真正落地？

2025-07-02

AI 如何成为认知导航仪？

2025-07-02

巨头混战Agent，押注背后是真未来还是新泡沫？

2025-07-01

什么才是AI时代最大的创业机会？

2025-07-01

大模型+Agent智能体：新一代全息立体防控体系如何重塑智慧公安？

2025-07-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB