我要投稿

Groq + Llama 3 实现本地 RAG：Phidata 框架的应用与性能展示

发布日期：2024-04-24 05:55:52 浏览次数： 3300 作者：kate人不错

Phidata 三方面增强 LLM 功能：

记忆：Phidata 通过存储聊天历史在数据库中，使大型语言模型能够支持更长时间的对话，从而更好地理解和跟踪对话上下文。
知识：通过将业务相关的信息存储在向量数据库中，Phidata 为模型提供了丰富的业务背景知识，增强了其对专业内容的理解和响应能力。
工具：Phidata 赋予了大型语言模型执行具体操作的能力，例如从 API 获取数据、发送电子邮件或进行数据库查询，从而扩展了模型的实用性和应用范围。

Phidata 工作流程

创建一个助手。
添加工具（即各种功能）、知识库（vectordb）和数据存储（database）。
通过使用 Streamlit、FastAPI 或 Django 等工具来部署和服务化你的AI应用。

注：

向量数据库（vectordb）主要用于存储和检索向量化的数据。在AI应用中，向量数据库通常用于增强模型的上下文理解能力，通过向量化的方式存储关键信息，支持复杂的查询和动态的内容推荐。例如，在推荐系统或语义搜索中非常有用。

数据存储（database）用于存储各种形式的数据，包括文本、数字、记录等。数据库在AI应用中主要用于持久化存储用户数据、交互历史和应用状态等。这些信息可用于后续的数据分析、报告生成或为持续的对话提供历史上下文。

Phidata 官方演示

https://hn.aidev.run/

https://arxiv.aidev.run/

推荐 Phidata 的一个主要原因是它更新迅速，并且支持多种大型语言模型（LLM）。

https://github.com/phidatahq/phidata/tree/main/cookbook/llms

安装 Phidata

pip install -U phidata

Groq 上使用 Llama3 实现 RAG

https://github.com/phidatahq/phidata/tree/main/cookbook/llms/groq/rag

对于词嵌入(Embeddings)，选择使用 Ollama 或 OpenAI。

1. 创建虚拟环境

python3 -m venv ~/.venvs/aienv
source ~/.venvs/aienv/bin/activate

2. 导出你的 Groq API 密钥

export GROQ_API_KEY=***

3. 使用 Ollama 或 OpenAI 生成词嵌入

要使用 Ollama 生成词嵌入，请先安装 Ollama，然后运行nomic-embed-text模型：

ollama run nomic-embed-text

要使用 OpenAI 生成词嵌入，请导出你的 OpenAI API 密钥：

export OPENAI_API_KEY=sk-***

4. 安装依赖库

pip install -r cookbook/llms/groq/rag/requirements.txt

5. 运行PgVector

先安装 Docker Desktop。然后使用辅助脚本运行：

./cookbook/run_pgvector.sh

或者直接使用docker run命令运行：

docker run -d \
  -e POSTGRES_DB=ai \
  -e POSTGRES_USER=ai \[app.py](..%2Fapp.py)
  -e POSTGRES_PASSWORD=ai \
  -e PGDATA=/var/lib/postgresql/data/pgdata \
  -v pgvolume:/var/lib/postgresql/data \
  -p 5532:5432 \
  --name pgvector \
  phidata/pgvector:16

6. 运行RAG应用

streamlit run cookbook/llms/groq/rag/app.py

打开localhost：8501查看你的RAG应用。

添加网站链接或PDF文件，然后提出问题。

实际体验

在运行 streamlit run cookbook/llms/groq/rag/app.py 时，如果系统提示缺少 psycopg 或 pgvector，你可以通过执行 pip install psycopg 和 pip install pgvector 来安装这些缺失的库。

我上传了一份 2MB 的 Phi-3 技术报告的 PDF 文件到程序中，模型在几秒内完成了文件的嵌入处理。

之后提出问题，可以即时得到答案。

这得益于 Groq 的高速生成能力，在 llama3-70b-8192 模型下，生成速度可达 280 Tokens/s。实际使用中，我发现用英文提问的效果比中文更好。

对网页内容提问

我对 Phidata 满意，它提供的示例代码简洁明了，易于理解。

此外，它还优化了输出格式，使得即使是在终端运行简单的 Python 文件，也能看到美观的输出结果。

结语

总的来说，Phidata 提供了一个强大且灵活的框架，可以大幅增强大型语言模型的能力。

通过整合记忆、知识和工具，Phidata 不仅优化了数据处理和交互效率，也极大地扩展了应用场景。

推荐大家体验。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

DeepSeek一体机和Qwen3一体机，选谁？

2025-05-09

谷歌 Prompt Engineering 白皮书中文版来了：DeepL 和沉浸式翻译谁更强？

2025-05-09

微软 Copilot 再添猛将！Researcher Agent 如何从数据到PPT一气呵成？

2025-05-09

25种RAG架构大揭秘：AI项目如何选型？

2025-05-08

阿里云发了MCP，意味着什么？

2025-05-08

LoRA为何成为大模型微调不可或缺的核心技术？

2025-05-07

AI Agent“虚火”过旺，或沦为“假Agent”？

2025-05-07

为什么AI多轮对话总是那么傻？

2025-05-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB