我要投稿

ChatOllama+Llama3创建基于网站URL的本地知识库

发布日期：2024-05-03 10:30:58 浏览次数： 2569 作者：前端程序设计

之前收到Ollama邮件推送，说支持embedding models。正好基于它的webui的chatollama更新了新的功能，不仅支持各种格式的多文档上传，还可以基于网站URL创造知识库，于是在本地试了一下，整体感觉还可以的。

源码地址：

https://github.com/sugarforever/chat-ollama

如果你是windows用户，在这里我建议直接运行源码就可以。docker的形式redis总启动不了，估计只能是Linux了。试了好多次都失败，所以最后选择用源码的方式。

源码是基于Nuxt 3实现的，运行起来也是非常方便的。

运行前提：

1. 安装并运行Ollama server

下载场景的模型，下面是我下载的几个模型，正好乘此机会体验一下最近活的Llama3。

为了对知识库进行分词，这里要用一下ollama最新出来的embedding模型 nomic-embed-text。

命令行中输入ollama list

启动Ollama: ollama serve, 通过http://localhost:11434得到验证。

2. 安装Chroma

可以参考官方文档去安装：https://docs.trychroma.com/getting-started

比较推荐用docker

docker pull chromadb/chroma
docker run -d -p 8000:8000 chromadb/chroma

启动后运行在http://localhost:8000

3. 从chatollama上下载源码，修改.env.example为.env文件。安装依赖

pnpm install

4. 迁移数据库：

pnpm prisma-migrate

5. 启动界面：

pnpm dev

如果是源码启动，就不需要设置，如果是docker启动，需要将endpoint的地方改成：

http://host.docker.internal:11434

这样在Models下就能看到所有下载的ollama模型。

6. 知识库设置：

这里主要体验一下通过url来建立知识库，这里的embedding第一次需要手动输入一下名称，我们看到url的抓取深度最大设置为3层，这个已经完全够我用了。

7. 聊天

选择相应的模型和知识库：

看到内容基本是符合要求的，而且速度也是非常快的。当然它也可以接入在线的各大模型，也可以上传各种格式的文档，就留给大家去体验了。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

伪装成浏览器的 AI Agent，好用吗？

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB