我要投稿

ChatOllama | 基于Ollama实现100%本地化RAG应用

发布日期：2024-04-06 07:34:52 浏览次数： 6523 来源：01麻瓜社

什么是RAG？

RAG - 检索增强生成，是优化大型语言模型的输出的过程，使其在生成响应之前引用其训练数据源之外的权威知识库。大型语言模型（LLMs）在大量数据上进行训练，并使用数十亿个参数来为回答问题、翻译语言和完成句子等任务生成原始输出。RAG将LLMs已经强大的能力扩展到特定领域或组织的内部知识库，而无需重新训练模型。这是一种成本效益高的方法，可以改善LLMs的输出，使其在各种情境中保持相关、准确和有用。

为什么RAG很重要？

LLMs是支撑智能聊天机器人和其他自然语言处理（NLP）应用的关键AI技术。其目标是通过交叉参考权威知识源，创建能够在各种情境下回答用户问题的机器人。然而，LLMs技术的特性导致其响应具有不可预测性。此外，LLMs的训练数据是静态的，并且在其知识上有一个截止日期。

LLMs已知的挑战包括：

在没有答案时提供错误信息。
在用户期望特定、当前响应时，提供过时或通用信息。
从非权威来源创建响应。
由于术语混淆而创建不准确的响应，不同的训练来源使用相同的术语来谈论不同的事情。

RAG是解决其中一些挑战的一种方法。它重定向LLM以从权威、预先确定的知识来源中检索相关信息。

为什么需要100%本地化RAG？

在RAG的应用场景中，特定领域的知识会被发送给LLM。当使用外部模型或服务时，用户将面临私有数据暴露给第三方的风险。比如，当企业使用OpenAI的服务时，RAG应用中的私有知识都被发送给OpenAI，这并不是所有用户所期望的。具有高度隐私性的数据拥有者更希望所有的数据交互都发生在组织内部。这正是100%本地化RAG的意义。

什么是Ollama?

Ollama是一款流行的大模型工具，用于在本地运行开源LLMs，包括Mistral和Llama 2等。Ollama将模型权重、配置和数据集捆绑到一个由Modelfile管理的统一包中。

Ollama支持各种LLMs，包括但不限于以下模型：

LLaMA-2
CodeLLaMA
Falcon
Mistral
Vicuna
WizardCoder

Ollama支持的LLM中包含了聊天模型和文本嵌入模型（Embedding Models），这正是RAG应用所需要的。基于Ollama，我们能够实现100%本地化的RAG应用。

ChatOllama

ChatOllama是我基于Ollama和Nuxt 3开发了一款简单的Web应用，演示100%本地化RAG应用的实现。代码开源于GitHub：

https://github.com/sugarforever/chat-ollama

ChatOllama支持的功能：

本地大模型的管理
基于本地模型的聊天
Ollama服务器的设置
创建知识库
基于知识库的聊天

基于知识库的聊天正是典型的RAG应用。这会用到如下组件：

本地聊天大模型
本地文本嵌入模型
向量数据库（Chromadb）
关系型数据库（SQLite）

本地聊天大模型

Ollama所支持的模型中有大量聊天模型可供选择，比如gemma，llama2，mistral等。

本地文本嵌入模型

Ollama支持目前非常流行的超长上下文窗口的文本嵌入模型nomic-embed-text。这也是在ChatOllama中我会使用的模型。

向量数据库（Chromadb）

在本地化RAG应用中，向量数据的本地存储可以有许多选择，比如Chromadb, Milvus等。在ChatOllama中选择了Chromadb，这也要求用户在运行ChatOllama时，在本地环境也运行Chroma服务器。

关系型数据库（SQLite）

关系型数据库SQLite用于存储应用中的关系型数据。目前存储的是知识库数据。

通过以上组件，我们就实现了100%本地化的RAG应用。

现在我们通过ChatOllama的几个截图来演示本地化RAG应用的主要功能。

下载模型至本地存储

这里我们以nomic-embed-text模型的下载为例。

创建知识库

选择文件，指定文本嵌入模型，设置名称，来创建知识库。

与知识库聊天

点击创建的知识库，进入聊天界面。

具体的代码实现，请参考代码仓库：

https://github.com/sugarforever/chat-ollama

希望ChatOllama能够给到大家在本地化LLM应用方面一些启发。

祝大家新的一周工作生活顺利！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

更改ollama模型存储路径

2024-04-25

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

大家都在问

大力出奇迹，苹果发售 10 万块的 Mac Studio M3 Ultra 能干什么？

2025-03-09

大模型的未来，是 Agent 还是 App？

2025-03-08

通用Agent未来形态什么样？

2025-03-08

5 个人、3 小时，开源复刻 Manus？

2025-03-08

Manus引爆AI Agent热潮：企业如何在这场科技革命中不掉队？

2025-03-07

Manus，为何是他们做出来了？

2025-03-07

一夜刷爆全网的Manus，说是比DeepSeek还牛B？

2025-03-07

DeepSeek-R1后，大模型为何集体‘死磕’思维链？

2025-03-05

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204 陈先生 185 8882 0121

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部