我要投稿

无需网络，轻松在手机上离线布署本地大模型

发布日期：2024-11-13 19:29:53 浏览次数： 2960 作者：山行AI

目前支持的移动端布署方式

1. Termux 安装法

优点： 可以在手机上安装 Termux，然后通过该工具安装 Linux 系统，并下载和运行大模型（如 Ollama、Llama 3和Phi-3等）。

缺点： 安装过程复杂，涉及大量命令行操作，需要在终端中进行设置和使用，使用体验差，适合技术专家或开发者。

具体安装过程参考： https://www.53ai.com/news/qianyanjishu/1795.html

总结： 比较适合有一定技术背景的用户，体验不如其他方法友好。

2. MLC

优点： 支持 GPU 调用，可能提升计算速度，较为推荐的方案。

AppStore可下载，安卓上使用方法参考：在手机上运行大模型（使用MLC-LLM） · Valdanitooooo/knowledge-hub · Discussion #66 · GitHub^[1] ，文档地址：Introduction to MLC LLM — mlc-llm 0.1.0 documentation^[2]

缺点： 使用旧手机时，容易出现黑屏等问题，可能是由于占用过多 GPU 资源。新手机可能会有所改善。

总结： 适合较新型号的手机，老旧设备可能体验较差。

3. Maid APP 安装法

优点： 通过安装 Maid APP，可以直接使用大模型，安装较为简便。

缺点： 需要科学上网，运行速度非常慢，使用体验差，不推荐使用。

总结： 虽然安装简便，但性能和速度的限制使得这不是一个理想选择。

4. PocketPal

优点： 国外的一个应用，运行方便，速度较快，适合大多数用户使用。开源，这是重点！！！

缺点： 安装包只能在谷歌商店下载，需要特殊网络才能使用，且国内用户访问速度慢

总结： 瑕不掩瑜，PocketPal AI是一款比较好的选择。

接下来，我们将重点就PocketPal AI进行更为详细的介绍。

关于PocketPal AI ??

PocketPal AI 是一款袖珍型的 AI 助手，基于小型语言模型（SLMs）运行，直接在您的手机上运行。它支持 iOS 和 Android，允许您在无需互联网连接的情况下与各种 SLMs 进行互动。

特点

•离线 AI 助手：直接在设备上运行语言模型，无需互联网连接。•模型灵活性：下载并切换多个 SLMs，包括 Danube 2 和 3、Phi、Gemma 2 和 Qwen。• 自动卸载/加载：当应用在后台时，自动管理内存，通过卸载模型来节省空间。 •推理设置：自定义模型参数，如系统提示、温度、BOS 标记和聊天模板。 • 实时性能指标：查看每秒生成的令牌数量和每个令牌的毫秒数。

安装

iOS

从 App Store 下载 PocketPal AI： 在 App Store 下载^[3]

Android

通过 Google Play 获取 PocketPal AI： 在 Google Play 获取^[4]

可用模型

PocketPal AI 预配置了一些流行的 SLMs（小型语言模型）：

•Danube 2 和 3•Phi•Gemma 2•Qwen

在使用之前，模型需要先下载。您可以直接从应用程序中下载并使用这些模型，还可以加载任何其他您喜欢的 GGUF 模型！

使用 PocketPal AI

有关如何使用 PocketPal AI 的详细指南，请查看入门指南^[5]。

下载模型

•点击汉堡菜单•进入“模型”页面•选择您需要的模型并点击下载

加载模型

下载后，点击加载按钮将模型加载到内存中。现在，您可以开始与模型对话！

小贴士

在 iOS 设备上，默认启用了 Apple 的 GPU API（Metal）。如果您遇到性能问题，可以尝试禁用它。

自动卸载/加载

为了保持设备运行顺畅，PocketPal AI 可以自动管理内存使用：

•在模型页面启用“自动卸载/加载”（默认启用）•当应用程序在后台时，它会卸载模型•当您返回时，模型会重新加载（对于较大的模型，可能需要等待几秒钟）

高级设置

点击箭头图标访问高级 LLM 设置，例如：

•温度•BOS 标记•聊天模板选项•等等

最后，让我们开始聊天！

一旦模型加载完成，进入“聊天”页面并开始与加载的模型对话！

生成性能指标也会显示。如果感兴趣，可以通过观察聊天气泡查看实时性能指标：每秒令牌数和每个令牌的毫秒数。

复制文本

重要提示：目前，我还没有找到一种简单的方法，可以在保留文本格式的同时，从生成的响应中选择并复制文本，尤其是 Markdown 格式的支持。

在此期间，以下是复制文本的当前选项：

•段落级复制：长按特定段落以复制其内容。•全部响应复制：点击文本气泡底部的复制图标以复制整个 AI 生成的响应。

我知道这些选项可能不太理想，这也是我在使用其他应用时遇到的困扰。复制文本部分内容的困难，曾是类似 ChatGPT 等聊天应用中的一个特别令人烦恼的问题。

开发者们：PocketPal AI 是使用 React Native 构建的。找到一个平衡文本选择与保留格式（特别是 Markdown 支持）的方法对我来说一直很困难。如果您有相关经验，我非常愿意听听您的意见！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

DeepSeek + Dify 企业级大模型私有化部署指南

2025-04-24

自主构建MCP，轻松实现云端部署！

2025-04-24

大模型微调框架LLaMA-Factory

2025-04-23

Unsloth：提升 LLM 微调效率的革命性开源工具

2025-04-23

超越 DevOps？VibeOps 引领 AI 驱动的开发革命

2025-04-23

大模型想 “专精” 特定任务？这 3 种 Addition-Based 微调法别错过

2025-04-23

重参数化微调：揭秘LoRA家族让大模型训练成本暴降的方法

2025-04-23

为什么全参数微调能让大模型从“通才”变“专才”？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

FP8 低精度训练：Transformer Engine 简析

2024-07-11

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

大家都在问

为什么全参数微调能让大模型从“通才”变“专才”？

2025-04-23

MCP vs Function Calling，该如何选？

2025-04-20

RAGFlow vs Dify, 商业化落地场景选哪个？

2025-04-01

如何利用Dify轻松构建你的专属语料库？

2025-03-31

从 0 到 1，Agentic Ops 如何打造企业级 AI 生产力？

2025-03-20

DeepSeek-R1的Qwen-32B蒸馏模型与QwQ-32B模型，谁更强？

2025-03-16

部署DeepSeek的4条路，企业级客户到底该咋走？

2025-03-16

谷歌Gemma 3 27b 到底能不能打，写个游戏测试下？

2025-03-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部