微信扫码
和创始人交个朋友
我要投稿
掌握本地运行大型语言模型的实用指南,体验高效、私密的AI应用开发。 核心内容: 1. Ollama框架:本地运行大型语言模型的利器 2. LangChain框架:构建AI驱动应用的桥梁 3. RAG技术与DeepSeek R1模型:提升AI响应的准确性和质量
本地运行DeepSeek R1 + RAG系统
? Ollama
Ollama 是一个用于在计算机上 本地运行大型语言模型 ()LLMs 的框架 。它允许您 下载、运行 AI 模型并与之交互, 而无需基于云的 API。
? 示例: ollama run deepseek-r1:1.5b
– 在本地运行 DeepSeek R1
? 为什么要使用它? 免费、私密、快速且离线工作。
? LangChain 语言链
LangChain 是一个 Python/JS
框架,用于通过与数据源、API 和内存集成LLMs来构建 AI 驱动的应用程序。
? 为什么要使用它?它有助于连接到LLMs实际应用程序,如聊天机器人、文档处理和 RAG。
? RAG(检索增强一代)
RAG 是一种 AI 技术,可检索外部数据(例如 PDF、数据库)并增强 LLM的响应。
? 为什么要使用它?通过引用实际文档来提高准确性并减少幻觉。
⚡ DeepSeek R1 模型
DeepSeek R1 是一个开源 AI 模型,针对推理、问题解决和事实检索进行了优化。
? 为什么要使用它?强大的逻辑功能,非常适合 RAG 应用程序,并且可以使用 Ollama 在本地运行。
? 它们如何协同工作?
示例用例:一个问答系统,允许用户上传 PDF 并提出有关它的问题,由 Ollama 上的 DeepSeek R1 + RAG + LangChain 提供支持!?
? 为什么在本地运行 DeepSeek R1?
隐私 | ||
速度 | ||
成本 | ||
定制 | ||
部署 |
? 下载 Ollama
Ollama 适用于 macOS、Linux 和 Windows。请按照以下步骤进行安装:
安装 Ollama 后,您可以运行 DeepSeek R1 模型。
? 运行 ollama 服务
$ ollama serve
? 提取 DeepSeek R1 模型
$ ollama pull deepseek-r1:1.5b
? 运行 DeepSeek R1
$ ollama run deepseek-r1:1.5b
它将初始化模型并允许您发送查询。
现在您已经运行了 DeepSeek R1,让我们使用 Streamlit 将其集成到检索增强生成 (RAG) 系统中。
? 先决条件
在运行 RAG 系统之前,请确保您已:
$ pip install -U langchain langchain-community
$ pip install streamlit
$ pip install pdfplumber
$ pip install semantic-chunkers
$ pip install open-text-embeddings
$ pip install faiss
$ pip install ollama
$ pip install prompt-template
$ pip install langchain
$ pip install langchain_experimental
$ pip install sentence-transformers
$ pip install faiss-cpu
? 创建项目
1️⃣ 创建新的项目目录
$ mkdir rag-system && cd rag-system
2️⃣ 创建 Python 脚本 (app.py
),粘贴以下基于 Streamlit 的脚本:
完整的代码文件:app.py[2]
脚本准备好后,启动 Streamlit 应用程序:
$ streamlit run app.py
上面的 Demo 是在我本地 Macos M3 电脑上运行成功,如果要运行改案例,需要保障有足够的内存。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-21
DeepRAG:LLM时代的智能检索革命(实测提升准确率21.99%)
2025-02-21
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
2025-02-20
传统分块已死?Agentic Chunking拯救语义断裂,实测RAG准确率飙升40%,LLM开发者必看!
2025-02-20
传统 RAG 与 Agentic RAG对比
2025-02-20
企业级内部的RAG系统,已经支持DeepSeek,PHP语言,可以做内部网的RAG
2025-02-19
尊敬的 IT 部门,请停止尝试构建自己的 RAG
2025-02-19
RAG+的一些前沿动向:兼看长文本、投标写作以及R1可解释性的有趣探索
2025-02-19
基于SC-Telco RAG技术的通信标准知识问答
2024-09-04
2024-10-27
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-02-15
2025-02-12
2025-02-05
2025-02-05
2025-01-24
2025-01-24
2025-01-20
2025-01-18