微信扫码
添加专属顾问
我要投稿
RAGapp[1] 是一个基于 Agentic RAG(Retrieval-Augmented Generation)模型的企业级应用,旨在简化企业使用 Agentic RAG 模型的过程。
项目提供了一个简单的 Docker 部署方式,允许用户在自己的云基础设施中部署和配置 RAGapp,项目由 LlamaIndex[2] 构建。
要运行RAGapp,可以使用以下命令启动一个Docker容器:
docker run -p 8000:8000 ragapp/ragapp
启动后,可以通过访问http://localhost:8000/admin
来配置你的RAGapp的Admin UI。
可以使用OpenAI或Gemini提供的托管AI模型,也可以使用Ollama[3]提供的本地模型。
Docker容器公开了以下端点:
http://localhost:8000/admin
http://localhost:8000
http://localhost:8000/docs
请注意,Chat UI和API只有在RAGapp配置完成后才能正常工作。
RAGapp默认不包含任何认证层。为了确保你的RAGapp安全,请在你的环境中保护/admin
路径。
RAGapp提供了一个docker-compose.yml
文件,以便在自己的基础设施中轻松部署RAGapp与Ollama和Qdrant[4]。
使用MODEL
环境变量,可以指定要使用的模型,例如llama3
:
MODEL=llama3 docker-compose up
如果没有指定MODEL
变量,默认使用的模型是phi3
,它比llama3
功能较弱,但下载速度更快。
注意:
docker-compose.yml
文件中的setup
容器将把选定的模型下载到ollama文件夹中,这可能需要几分钟时间。
使用OLLAMA_BASE_URL
环境变量,可以指定要使用的Ollama主机。如果没有指定OLLAMA_BASE_URL
变量,默认指向由Docker Compose启动的Ollama实例(http://ollama:11434
)。
如果正在运行本地Ollama实例,可以通过设置OLLAMA_BASE_URL
变量将其连接到RAGapp:
MODEL=llama3 OLLAMA_BASE_URL=http://host.docker.internal:11434 docker-compose up
如果在macOS上运行RAGapp,这将非常有用,因为Docker for Mac不支持GPU加速。
在自己的云基础设施中部署RAGapp也很容易。定制的Kubernetes部署即将推出。
注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-19
基于Embedding分块 - 文本分块(Text Splitting),RAG不可缺失的重要环节
2025-04-19
RAG升级-基于知识图谱+deepseek打造强大的个人知识库问答机器人
2025-04-19
RAG vs. CAG vs. Fine-Tuning:如何为你的大语言模型选择最合适的“脑力升级”?
2025-04-19
低代码 RAG 只是信息搬运工,Graph RAG 让 AI 具备垂直深度推理能力!
2025-04-18
微软PIKE-RAG全面解析:解锁工业级应用领域知识理解与推理
2025-04-18
AI 记忆不等于 RAG:对话式 AI 为何需要超越检索增强
2025-04-18
Firecrawl:颠覆传统爬虫的AI黑科技,如何为LLM时代赋能
2025-04-18
什么是RAG与为什么要RAG?
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-19
2025-04-18
2025-04-16
2025-04-14
2025-04-13
2025-04-11
2025-04-09
2025-04-07