我要投稿

跨平台载入大模型&客制化 | Ollama + Hf社区

发布日期：2024-04-18 08:21:49 浏览次数： 3132

作者：SuuJiKat

微信搜一搜，关注“SuuJiKat”

之前提及了如何用ollama本地部署模型，模型的来源都是ollama的官方库，这期将探讨如何跨平台使用大模型。

把大模型装进笔记本里：Ollama+Open Web UI

首先肯定需要ollam（目前最好用的一体化部署、配置模型工具）作为模型部署工具，然后从huggingface（世界上最大的自然语言社区）或者modelscope（国内的hf社区）来获取gguf格式的大模型文件。

GGUF（GPT-Generated Unified Format）是一种二进制文件格式，特别为提高模型加载和保存的效率而开发，尤其适用于推理过程中。这种格式优化了与llama.cpp等执行框架的兼容性，这些框架支持GGUF格式。GGUF不仅包含张量数据，还包含了一组标准化的元数据，这有助于执行框架在不需要繁琐配置的情况下理解模型的结构和设置。

一、部署GGUF文件

首先我们用ollama show --help来查看ollama演示的命令，其实尤为重要的是modelfile，这是模型的设置文件，里面有模型路径及提示词的信息，而我们从外部导入模型就需要配置其他模型的modelfile。

下图就是qwen:7b的模型配置信息，From+路劲就是模型地址，template就是提示词（每个模型默认都不同）。

首先我们到hf社区（modelscope社区也行），在搜索框中输入gguf并获取最受欢迎的模型。这里挑选个小点的模型下载做演示。

在这个模型清单中，一般来说，量化级别越高（数字越大），模型文件越小，运行时占用的内存和磁盘空间也越少，但可能会略微牺牲精度或响应速度。最底下的那个模型就是性能发挥最完整的，但这里演示我选最上面的那个了。

二、客制化大模型

这里客制化大模型的主要操作就是在模型配置文件中进行参数修改。模型下载完后我们在模型的文件路径中创建Modelfile文件，按照上面qwen:7b的模型配置文件格式填写，而提示词样例可以到刚才模型的官网复制示例提示词，这里我们不按照模板填写，我们自己设置提示词模板，给定模型一些先决条件或参数，比如temperature（控制模型输出的随意性），下面是一个模板：

FROM: qwen:7b
PARAMETER:
  - temperature: 0.1
  - num_ctx: 4096
TEMPLATE: "提示词模板"
SYSTEM:
  message: "把英文翻译成中文"

那么接下来我就让这个新模型弄成一个马斯克聊天机器人：

模型配置文件弄好后保存并输入以下命令把模型加载到ollama中：

# 这里myModel是你要给你新建模型取的名字，-f是读取后面的Modelfile文件，包括地址和模型提示词。
ollama create myModel -f Modelfile
# 然后运行这个客制化模型
ollama run MyModel

感觉效果不那么明显，可能是提示词没到位or知识库有限、模型体量，anyway这就是大模型跨平台载入ollama和客制化本地模型的方法。

这里就演示到这了，现在我们可以随意部署本地大模型了，hf社区的更新资源是最快的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

从需求场景出发的AI应用项目落地方法论

2025-09-19

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

Qwen3-Coder与Claude Code深度对比：谁是你的AI编程助手？

2025-09-14

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

大家都在问

如何在Cursor、Trae等工具中使用Skills？

2025-12-03

Bun × Anthropic：AI 运行时变革的信号？

2025-12-03

如何写出完美的Prompt（提示词）？

2025-12-02

MCP是不是真凉了？

2025-12-01

大模型落地最后一公里：为什么企业必须重构对“本体（Ontology）”的认知？

2025-12-01

AI 的“谄媚”与“幻觉”：如何用对抗性 Prompting 逼出真话？

2025-11-29

如何规划一个「有节奏感」的AI产品路线图？

2025-11-28

AI Agent是「未来应用入口」，还是又一轮「技术泡沫」？

2025-11-27

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB