我要投稿

50K star！构建离线的私有GPT，隐私不再泄露

发布日期：2024-04-18 17:55:18 浏览次数： 3013

作者：IT咖啡馆

微信搜一搜，关注“IT咖啡馆”

随着越来越多的人使用ChatGPT等AI产品，用户的数据隐私泄露也越来越被重视。

今天我们介绍一个开源项目，它让用户可以在离线的情况下，使用大模型的能力来查询本地文档，不再担心隐私数据泄露，它就是：PrivateGPT

PrivateGPT 是什么

PrivateGPT 是一个可立即投入生产的 AI 项目，即使在没有 Internet 连接的情况下，您也可以使用大型语言模型 (LLM) 的功能来询问有关文档的问题。100% 私有，任何数据都不会离开您的执行环境。

PrivateGPT 是一项服务，它将一组 AI RAG 原语包装在一组全面的 API 中，提供私有、安全、可定制且易于使用的 GenAI 开发框架。它支持各种本地和远程的 LLM 提供商、嵌入提供商和向量存储。这些可以轻松更改，而无需更改代码库。

整体架构

它使用FastAPI和LLamaIndex作为其核心框架。这些可以通过更改代码库本身来定制。

该项目提供了一个 API，提供构建私有的、上下文感知的 AI 应用程序所需的所有原语。它遵循并扩展了OpenAI API 标准，支持普通响应和流式响应。API 分为两个逻辑块：

高级 API，抽象了 RAG（检索增强生成）管道实现的所有复杂性：

文档提取：内部管理文档解析、分割、元数据提取、嵌入生成和存储。
使用所提取文档中的上下文进行聊天和完成：抽象上下文检索、提示工程和响应生成。

低级 API，允许高级用户实现自己的复杂管道：

嵌入生成：基于一段文本。
上下文块检索：给定查询，从提取的文档中返回最相关的文本块。

除此之外，还提供了一个可用的Gradio UI 客户端来测试 API，以及一组有用的工具，例如批量模型下载脚本、提取脚本、文档文件夹监视等。

安装 PrivateGPT

开始安装前需要确认一些基础的环境情况：

Python =>3.11 make poetry

对于快速安装可以参考以下的步骤：

# Clone the repogit clone <https://github.com/imartinez/privateGPT>cd privateGPT
# Install Python 3.11pyenv install 3.11pyenv local 3.11
# Install dependenciespoetry install --with ui,local
# Download Embedding and LLM modelspoetry run python scripts/setup
# (Optional) For Mac with Metal GPU, enable it. Check Installation and Settings section to know how to enable GPU on other platformsCMAKE_ARGS="-DLLAMA_METAL=on" pip install --force-reinstall --no-cache-dir llama-cpp-python
# Run the local serverPGPT_PROFILES=local make run
# Note: on Mac with Metal you should see a ggml_metal_add_buffer log, stating GPU is being used
# Navigate to the UI and try it out! <http://localhost:8001/>

为了获得最佳性能，建议使用 GPU 加速。PrivateGPT 支持与llama.cpp兼容的模型的本地执行。提供了两种运行良好的已知模型来实现无缝设置：

1.TheBloke/Llama-2–7B-chat-GGUF

2.TheBloke/Mistral-7B-Instruct-v0.1-GGUF

使用 PrivateGPT

安全完成后可以到 http://localhost:8001/ 访问web服务。

它有3种执行模式（可以在左上角选择）：

查询文档：使用提取文档中的上下文来回答聊天中发布的问题。它还将之前的聊天消息作为上下文考虑。
在文档中搜索：快速搜索，返回 4 个最相关的文本块及其源文档和页面。
LLM 聊天：与 LLM 进行简单、非上下文的聊天。不会考虑提取的文档，只会考虑之前的消息。

总结

PrivateGPT 的思路和方向和目前很多国内的研究一致，大家都是在探索一种及使用大模型能力，同时又保障足够的数据隐私安全，并且这种引入向量存储的方法一定程度上可以提升相应的准确度的速度（在特定的问题场景下）。

个人觉得这个项目更多的可以给我们延伸的思考，当然直接拿来用也不错。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

豆包 2.0 模型发布，全信息整理（全网最完整，另附 79 页 Model Card）

2026-02-14

刚刚！Codex 居然能直接画图了，OpenAI 凌晨甩出 Image 2.0

2026-04-22

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

OpenAI Codex CLI 完整使用指南

2026-04-07

Google Gemma 4 开源｜全面解读

2026-04-03

全网最详细的Codex入门教程，手把手教你玩转Vibe Coding。

2026-02-09

大家都在问

1G内存检索2500万向量，Milvus中如何用FLAT在强标量过滤场景搞定毫秒响应？

2026-05-07

为什么同一个模型，在 Claude Code/Codex CLI 里感觉像换了个脑子？

2026-05-07

多Agent场景，子agent 之间数据读写不同步，如何解决？

2026-05-06

如何从0到1创建一个画原型的Skills？

2026-04-29

如何把经验装到Skills？

2026-04-29

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

你写的 Skill，及格了吗？

2026-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部