我要投稿

58k+star！ollama快速部署llama3大模型

发布日期：2024-05-02 18:19:55 浏览次数： 3380

作者：AI小新

微信搜一搜，关注“AI小新”

本期给大家推荐有58k+star的开源大模型管理项目：ollama；

ollama是一款旨在简化大语言模型本地部署和运行的实用工具。它提供了一个轻量级且可扩展的框架,让开发者能够在本地机器上便捷地构建和管理LLMs。

这个框架非常适合初学者使用,它的调用方式已经封装成与OpenAI ChatGPT相同的标准输入输出,方便对接上层的问答系统。它支持众多大型模型,只需一个命令即可下载模型文件并启动服务,使用起来十分便捷高效。本文主要介绍如何利用docker部署ollama工具，快速部署llama3大模型服务。

下面是ollama支持的大模型列表：

完整的模型列表可以访问： https://ollama.com/library

github地址：

https://github.com/ollama/ollama

官网下载地址：

https://ollama.com/download

ollama的安装过程简洁明了,如果你是macOS、Windows、Linux，可以直接访问上面的官网地址，下载安装包，一键安装服务，在此处就不详细叙述了。

大部分的情况下，服务器一般都是linux的操作系统，本文推荐使用docker方式部署,方便系统环境之间的隔离！下面主要介绍如何利用docker安装ollama工具，并运行llama3大模型！

本文内容主要分为三个部分：

一、CPU方式部署ollama

二、GPU方式部署ollama

三、llama3 大模型的使用教程

下面开始正式教程

部署前的准备工作：

1、安装好docker；

2、内存或者显存大小要求：

7B模型-至少需要8GB可用内存(显存)；

13B模型-至少需要16GB可用内存(显存)；

一、CPU方式部署ollama

1、拉取docker镜像

docker pull ollama/ollama

2、部署ollama容器

docker run -d -v  $PWD/ollama:/root/.ollama -p 11434:11434 \--name ollama ollama/ollama

参数说明：

--name ollama ：表示创建的容器名为ollama ；

-p 11434:11434：表示你的服务器11434端口，映射到容器内的11434端口；需要确保你的服务器11434端口未被占用

$PWD:表示当前位置的绝对路径；

-v $PWD/ollama:/root/.ollama：将服务器上当前所在路径下的ollama目录挂载映射到容器内的/root/.ollama目录；

ollama/ollama：表示你的镜像名；

3、进入ollama容器内部

docker exec -it ollama /bin/bash

4、运行llama3 模型服务

ollama run llama3

模型文件会自动下载；

等待下载完成即可，详细的使用教程请看下面的第三小节；

二、GPU方式部署ollama

1、安装 NVIDIA Container Toolkit. (若已安装则跳过这步！)

详细教程：

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html#installation

2、利用docker创建ollama容器

docker run -d --gpus=all -v $PWD/ollama:/root/.ollama \-p 11434:11434 --name ollama ollama/ollama

参数说明：

--gpus=all : 挂载全部的gpu

--name ollama ：表示创建的容器名为ollama ；

-p 11434:11434：表示你的服务器11434端口，映射到容器内的11434端口；需要确保你的服务器11434端口未被占用

$PWD:表示当前位置的绝对路径；

-v $PWD/ollama:/root/.ollama：将服务器上当前所在路径下的ollama目录挂载映射到容器内的/root/.ollama目录；

ollama/ollama：表示你的镜像名；

容器部署成功后截图：

3、进入ollama容器内部

docker exec -it ollama /bin/bash

4、运行llama3 模型服务

ollama run llama3

模型文件会自动下载；

等待下载完成

问题1：你是谁？

问题2：你会做什么？使用中文回答

llama3-7B的模型权重文件大小：4.3 GB左右：

三、llama3 大模型的使用教程

1、curl命令行调用方式

浏览器访问：ip:11434；可以看到显示ollama服务器正在运行；

利用curl的方式调用llama3大模型

curl http://localhost:11434/v1/chat/completions \    -H "Content-Type: application/json" \    -d '{        "model": "llama3",        "messages": [            {                "role": "system",                "content": "You are a helpful assistant."            },            {                "role": "user",                "content": "Hello!"            }        ]    }'

运行后截图：

2、 python 代码调用llama3大模型

url="http://ip:11434/v1/chat/completions"

完整代码如下：

#!/usr/bin/env python# -*- coding: UTF-8 -*-"""@File    ：ollama_function.py@Author  ：aixiaoxin@Date import requests
def request_chatgpt_function():    url="http://ip:11434/v1/chat/completions"   #ip为你部署的ip    OPENAI_API_KEY="sk-xxxxx"  # 不需要修改    header={"Content-Type": "application/json","Authorization": "Bearer " +OPENAI_API_KEY}    data={        "model": "llama3",        "messages": [          {            "role": "system",            "content": "You are a helpful assistant."          },          {            "role": "user",            "content": "你是谁？请用中文回答"          }        ],        "temperature":0,        "stream":False      }    response=requests.post(url=url,headers=header,json=data).json()    print(response)    return response
if __name__ == "__main__":    request_chatgpt_function()  # 利用request请求调用

运行截图：

更多调用chatgpt的方式，可以参考下面的文章：

python调用chatgpt的三种方法

以上就是今天的所有内容了！

若有任何gpt相关疑问，可以扫码加入技术交流群，一起探讨，可以通过公众号回复数字2，获取最新二维码。

参考文献：

ollama的docker部署教程：https://hub.docker.com/r/ollama/ollama

「往期精彩」

点击蓝字可直接查看

28k+star开源项目LobeChat的部署与使用教程

13k+star的LLM接口管理系统one-api的部署教程

ChatGLM3-6B大模型的部署与使用教程（保姆级）

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

从需求场景出发的AI应用项目落地方法论

2025-09-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

Qwen3-Coder与Claude Code深度对比：谁是你的AI编程助手？

2025-09-14

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

大家都在问

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

LoAR做Fine-Tuning微调原理到底是什么？

2025-11-19

如何利用 Google NotebookLM 实现精准、可溯源的内容生成呢？

2025-11-19

Snowflake CEO 复盘：为什么 LLM 时代企业需要一个 AI Data Cloud？

2025-11-19

为什么Mac在AI时代更有性价比？

2025-11-19

EI Search：生成式AI时代的知识探索新范式？

2025-11-18

Kosmos发布：一个让博士生“失业"的科研AI？

2025-11-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB