我要投稿

AI在用| 没错，树莓派5也能飙上Llama 3了！

发布日期：2024-04-23 23:17:15 浏览次数： 3686

作者：机器之能

微信搜一搜，关注“机器之能”

以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。

因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。

我们也欢迎读者投稿亲自实践的创新型用例。

4 月 18 日，Meta 发布了 Llama 3，号称「迄今最强的开源大模型」。根据 Meta 的说法，Llama 3 在多个关键基准测试中超越了业界领先的同类模型，在代码生成等任务上实现了全面领先。该模型能够进行复杂的推理，更加遵循指令，能够可视化想法并解决许多微妙的问题。

开源 Llama 3 系列模型包括 8B（80 亿参数）和 70B（700 亿参数）两种参数规模的版本。作为开源界的「全村希望」，Llama 3 一经发布就吸引不少网友参与「试驾」活动。今天，我们介绍其中一个令人印象深刻的应用 —— 在不到 100 美元的树莓派 5 上跑 Llama 3 8B！

树莓派系列是全球最为知名的袖珍型小巧却又性能强大的迷你电脑，5 代版本配置更强还有新定制的芯片。X 网友 @adamcohenhillel 发现， Llama3 8B 能在树莓派 5 以每秒 1.89 个 token 的速度运行，非常疯狂！支持 8K 上下文窗口。

让 Llama3 向世界打个招呼，Llama3 很快响应：「HEY WORLD！How’s everyone doing today?」，仅用 11.6 秒。对于在树莓派这样的设备上运行大模型来说，这个响应速度已经很不错了，可以满足一些实时应用需求。

案例地址：

https://twitter.com/adamcohenhillel/status/1781490719997526210

如何在树莓派 5 上跑出 Llama 3 8B，@adamcohenhillel 并未给出详细步骤，但他推荐了在树莓派 5 上运行 Mistral 7B 的操作指南，可以如法炮制。

值得注意的是，由于移动设备、嵌入式系统或边缘计算设备的硬件资源有限，4bit 量化可以显著减少模型的大小和计算需求，使得在这些设备上运行大型模型成为可能。这位用户也使用了 4bit 量化推理 Llama3 8B。

以下就是如何在树莓派 5 上运行大语言模型 Mistral 7B 操作指南。

首先请确保你有一台树莓派 5，配备至少 8GB 内存，准备一个 32GB 的 SD 卡。接下来，我们需要给硬件安装操作系统。从官网下载 Raspberry Pi OS，运行后你会看到如下画面：

请选择设备 Raspberry Pi 5、选择最新操作系统镜像（推荐 64 位版本）、选择存储为插入的 SD 卡。点击「next」，系统问你是否要编辑设置，请点击「编辑设置」：

配置设定上，启用主机名并设置为 raspberrypi.local；设置一个你将记住的用户名和密码，稍后会用到；启用「配置无线局域网」并添加你的 Wi-Fi 名称和密码；保存设置并继续，等待操作系统写入 SD 卡：

将 SD 卡插入树莓派，并连接电源。使用 SSH ( Secure Shell ) 协议远程连接并登录到树莓派设备：

ssh ssh <YOUR_USERNAME>@raspberrypi.local

好了，在树莓派上构建出适合运行大语言模型的环境后，接下来就该将大语言模型装进来啦！怎么装？作者提供了两个办法。

一个是用 Ollama 来运行大语言模型。Ollama 是一个开源工具，透过它提供简单的安装指令和命令行界面，在本地运行大语言模型会变得更加简单和快捷。

另一个就是用 llama.cpp 运行，它是一个用 C++ 编写的高效的推理工具，用于在 CPU 上运行 Meta AI 的 Llama。

先来看第一个办法。用 Ollama 运行大语言模型只需两步。

第一步：安装 Ollama，运行这个命令：

curl -fsSL https://ollama.com/install.sh | sh

这个命令会从 Ollama 的官网下载安装脚本并执行它，在树莓派上安装 Ollama。

第二步：下载并运行 Mistral 模型。使用命令 ollama run mistral 来下载并启动 Mistral 7B 模型。结束。

相比第一个办法，第二个办法 —— 使用 llama.cpp 来运行大语言模型——稍显复杂。

第一步：安装必要的软件包。打开命令行工具，输入以下命令更新软件包列表并安装一些必需的编程工具和库：

sudo apt update && sudo apt install git g++ wget build-essential

第二步：下载 llama.cpp。使用 Git 控制工具下载 llama.cpp 代码库，这个库是专门用来运行大型语言模型的。命令是：

git clone https://github.com/ggerganov/llama.cpp

cd llama.cpp

从 GitHub 上克隆代码到本地并切换到下载的目录。

第三步：编译 llama.cpp。

输入 make -j 让 make 工具自动将源代码转换为可执行程序。

第四步：找到并下载 Mistral 7B 模型。命令是：

cd models

wgethttps://huggingface.co/TheBloke/Mistral-7B-v0.1-GGUF/resolve/main/mistral-7b-v0.1.Q4_K_S.gguf

第五步：回到代码库根目录并运行模型，现在可以让它回答「What’s up？」等问题啦。搞定，结束。

cd ..

./main -m models/mistral-7b-v0.1.Q4_K_S.gguf -p "Whatsup?" -n 400 -e

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

高效 Agents 构建指南

2025-05-23

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

从RAG到CoT再到MCP，一文读懂AI Agent落地难题｜大模型研究

2025-05-07

大家都在问

全球首个A股金融智能体?

2025-07-18

王坚对谈黄仁勋，都聊了啥？

2025-07-18

那些率先实现了 AI 落地的公司，做对了什么？

2025-07-18

Data Agent如何化身“电子牛马”，深度懂你为企业解忧？

2025-07-17

2025-07-17

2025-07-16

2025-07-16

2025-07-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB