我要投稿

localai——本地AI项目openai代替品

发布日期：2024-04-12 21:26:23 浏览次数： 2686 来源：可爱的小Cherry

前言

大家好，这里是可爱的Cherry。

今天为大家带来一款不需要依托GPU也可以在本地运行离线AI项目——LoaclAI

该项目可以运行任何自定义的AI模型，最重要的是可以代替openAI的API用在本地的浏览界面上。

系统部署

?系统部署前，先新建一个文件夹，本文实例中为/volume1/docker/localai/models。

一、下载模型

?下载模型，把模型放到刚才新建的文件夹/volume1/docker/localai/models下。这里推荐的模型下载站点，第一抱脸虫（huggingface）了，访问的话需要魔法。国内用户的可以访问抱脸虫镜像站hf-mirror.

二、docker-compose.yaml代码

?新建一个文件夹，可以用项目为名字。在文件夹下新建一个docker-compose.yaml文件，将下面代码复制进去。

version: "3.6"services:api:image: quay.io/go-skynet/local-ai:master-ffmpeg-coreports:- 56787:8080environment:- MODELS_PATH=/models#- DEBUG=true- CORS=true#允许跨越访问，使用api必须开启- CORS_ALLOW_ORIGINS=* #允许跨域的白名单- THREADS=4#这里是线程数，根据CPU情况调整volumes:- /volume1/docker/localai/models:/models:cachednetworks: {}

三、SSH部署（推荐）

通过SSH工具，例如finalshell，登录NAS系统，输入如下指令。

#来到文件夹cd /volume1/docker/localai/#启动容器，这里需要NAS管理员密码sudo docker-compose up -d

四、群晖部署compose（群晖7.2）

打开container manager，选择项目，点击新建，选择localai路径，点击下一步即可

五、威联通部署compose

打开container station，创建应用程序，复制代码验证后部署即可

系统使用

一、查询现有模型

?项目支持两种模式查询现有的模型，第一种是打开网页查看http(s)://ip:port/v1/models

第二种是通过curl指令查询，curl http(s)://localhosy:port/v1/models

二、API使用方案

curl http://localhost:56787/v1/completions -H "Content-Type: application/json" -d '{ "model": "phi-2.Q8_0.gguf", "prompt": "A long time ago in a galaxy far, far away", "temperature": 0.7 }'

model是模型的名字，就是/volume1/docker/models文件夹下的具体模型名字prompt是发送的内容
temperature是创造力水平，默认0.7

这是返回的结果，沿着我们输入的文本继续往下走了。

三、和chatgpt-next-web对接

?输入自定义接口地址，http://ip:port，不需要填/v1/competions的路径,模型还是选择phi-2.Q8_0.gguf

?开启新对话设置，选择刚才的模型，并定义随机性、新鲜度等参数值。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

OpenAI o1与GPT4o的对比分析

2024-09-23

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

2024-04-12

大家都在问

RAG、LangChain、Agent 到底有啥关系？

2025-02-23

Tokens是啥？为啥大模型按Tokens收费？和API调用、订阅收费区别？

2025-02-23

Jetson 引爆 DeepSeek 边缘 AI？

2025-02-23

开源VS闭源，DeepSeek是最好选择吗？

2025-02-23

DeepSeek 为什么总是服务器繁忙？

2025-02-22

一觉醒来，DeepSeek开始“领导”公务员了？

2025-02-22

为什么马斯克认为 Google 才是xAI的终极对手？

2025-02-22

通义千问与文心一言对比评测：谁才是苹果AI的“黄金搭档”？

2025-02-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204 陈先生 185 8882 0121

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

和创始人交个朋友

回到顶部