我要投稿

运行 Meta AI 的 Llama 3.1 8B：实践指南

发布日期：2024-08-21 08:59:19 浏览次数： 2763

作者：barry的异想世界

微信搜一搜，关注“barry的异想世界”

介绍

Meta 的 Llama 3.1 是一个强大的大型语言模型（LLM），在文本生成、翻译和问答方面具有令人印象深刻的能力。然而，使用尖端的 LLM 通常需要云资源。本教程使您能够直接在本地计算机上运行 Meta Llama 3.1 的 8B 版本，让您对 AI 交互拥有更多的控制权和隐私。

先决条件：

Python 3.x（下载地址：https://www.python.org/downloads/）
PyTorch（安装说明：https://pytorch.org/get-started）
Transformers 库（pip install transformers）
Hugging Face 账户（免费创建：https://huggingface.co/）

获取访问令牌

要访问 Hugging Face Hub 上的模型，您需要一个免费的访问令牌。请在 Hugging Face 上创建一个账户，并按照说明生成您的令牌：

登录 Hugging Face： 确保您拥有 Hugging Face 账户并登录到您的个人资料。
导航到设置： 点击右上角的个人资料图片，从下拉菜单中选择“设置”。
访问令牌选项卡： 在左侧边栏中找到并点击“访问令牌”选项卡。
创建新令牌： 点击“新令牌”按钮。
选择名称和范围： 为您的令牌提供一个描述性名称（例如，“Python 脚本访问”），并选择适当的范围。范围定义了授予令牌的权限。对于大多数用例，“读取”访问权限就足够了。
生成并复制： 点击“生成令牌”按钮。令牌将仅显示一次。请安全地复制它，因为您将无法再次查看。

代码解析

提供的 Python 代码便于使用 Llama 3.1 3B 模型进行文本生成。让我们分解关键组件：

导入库：

transformers：提供与预训练模型一起使用的工具。
torch：Llama 3.1 使用的深度学习框架。

访问令牌和模型 ID：

将 '' 替换为您的 Hugging Face 访问令牌。
model_id 指定 Llama 3.1 的特定版本（meta-llama/Meta-Llama-3.1-8B-Instruct）。

加载模型和分词器：

Transformers 中的 AutoTokenizer 和 AutoModelForCausalLM 函数使用您的访问令牌从 Hugging Face Hub 加载模型和分词器。

GPU 加速（可选）：

代码检查 GPU 可用性，并将模型移动到 GPU 以加快处理速度。

对话结束令牌：

这些令牌表示对话或句子的结束。

**generate_text** 函数：

此函数接受多个参数：
message：用户提示以启动对话。
history（可选）：包含用户和助手消息的元组列表，以提供上下文。
temperature（可选）：控制生成的随机性（0 = 确定性，1 = 更随机）。
max_new_tokens（可选）：响应中生成的最大令牌数。
system（可选）：提供上下文的可选系统提示。
该函数构建对话历史，将其转换为模型兼容格式，并根据指定参数生成文本。

示例用法：

演示如何使用带有提示和示例历史的 generate_text 函数。

运行代码

将代码保存为 Python 脚本（例如，llama_local.py）。
打开终端或命令提示符，导航到包含脚本的目录。
使用 python llama_local.py 运行脚本。

与 Llama 进行实验

运行脚本后，您可以与 Llama 进行交互！提供提示并观察生成的响应。尝试不同的 temperature 和 max_new_tokens 值，以调整响应的随机性和长度。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-05

Ollama新版功能：AI思维链控制

2025-07-05

炸裂！AI“读心术”被破解，我们终于能亲眼看见它的思考过程了！

2025-07-05

智谱新出的模型，做PPT太会整活了

2025-07-05

微软裁员9000人！给员工整不会了：用不用AI都要被裁？

2025-07-04

Karpathy：我不是要造新词，是「上下文工程」对 Agent 来说太重要了

2025-07-04

AI Agent的核心：Context Engineering（上下文工程）

2025-07-04

AI Agent与AI Workflow：“对决”与“共生”，未来属于“混血儿”！

2025-07-04

破局AI内卷：揭秘驱动10倍效能的AI工作流三大核心技术支柱

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

教你解决GPT4o无法使用新版生图功能的教程

2025-04-11

AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

2025-04-12

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

高效 Agents 构建指南

2025-05-23

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

豆包，让有独立显卡的电脑都能部署本地大模型，语料库就是电脑里的文件

2025-04-17

大家都在问

微软裁员9000人！给员工整不会了：用不用AI都要被裁？

2025-07-05

智能体（Agent）是怎么知道什么时候要调用 Tool 的？

2025-07-04

AI狂潮下：大公司如何破解"创新者窘境"？

2025-07-04

Anthropic多智能体如何破解企业级任务并行处理瓶颈？

2025-07-03

AI 商业化，Salesforce 做对了什么？

2025-07-03

AI 编程如何在团队中真正落地？

2025-07-02

AI 如何成为认知导航仪？

2025-07-02

巨头混战Agent，押注背后是真未来还是新泡沫？

2025-07-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部