微信扫码
与创始人交个朋友
我要投稿
下面进入正题,首先演示功能比较简单,这里使用一个现成的开源框架,对于有一定编程基础的兄弟,完全可以手撸一个。
准备材料:
ollama :https://ollama.com/download
docker :https://www.docker.com/products/docker-desktop/
phidata :https://github.com/phidatahq/phidata
先安装ollama和docker
然后打开CMD窗口拉取phidata项目,使用conda安装虚拟环境
git clone https://github.com/phidatahq/phidata.gitcd phidataconda create -n phidata python=3.9 --yespip install -U phidatapip install -r requirements.txtpip install ollama tavily-python streamlit
环境安装好之后我们使用tavily来调用搜索引擎API获取网络信息推送给Llama3处理。这里只是演示,你可以根据自己需要换其他搜索接口。
https://app.tavily.com/home 到这里注册一个账户获取api key,不要钱
创建一个环境变量,替换成你自己的key
win:set TAVILY_API_KEY=tvly-xxxxxxxxxxxlinux:export TAVILY_API_KEY=tvly-xxxxxxxxxxx
将下面的代码保存到位于项目根目录的python文件中
from phi.assistant import Assistant
from phi.llm.ollama import OllamaTools
from phi.tools.tavily import TavilyTools
# 创建一个Assistant实例,配置其使用OllamaTools中的llama3模型,并整合Tavily工具
assistant = Assistant(
llm=OllamaTools(model="llama3",host="127.0.0.1:11434"), # 使用OllamaTools的llama3模型
tools=[TavilyTools()],
show_tool_calls=True,# 设置为True以展示工具调用信息
)
# 使用助手实例输出请求的响应,并以Markdown格式展示结果
assistant.print_response("Search tavily for 'GPT-5'", markdown=True)
保存之后运行python文件
窗口返回了查询结果,一段GPT-5的介绍和几个相关的网页链接,这就为Llama3提供了实时联网过去最新信息的能力。框架提供多种联网查询的工具这里就不每个介绍了,有兴趣的可以看项目文档,功能十分丰富,三天三夜讲不完。
由于这是一个国外的开源项目,提供的接口对墙内不太友好,需要自备网络环境,也可以自己动手封装国内搜索接口,项目提供了详细的开发文档,非常的Nice。
接下来,再来看一看项目中如何使用Ollama和PgVector进行完全本地文档的检索增强生成(RAG)
所有操作在项目根目录下完成
安装Embeddings模型和依赖:
ollama pull nomic-embed-textpip install -r cookbook/llms/ollama/rag/requirements.txt
使用Docker运行PgVector
docker run -d -e POSTGRES_DB=ai -e POSTGRES_USER=ai -e POSTGRES_PASSWORD=ai -e PGDATA=/var/lib/postgresql/data/pgdata -v pgvolume:/var/lib/postgresql/data -p 5532:5432 --name pgvector phidata/pgvector:16streamlit run cookbook/llms/ollama/rag/app.py
然后打开浏览器:http://localhost:8501/
现在就可以上传PDF文档生成向量数据库供Llama3调用了。
以上只是使用了项目中两个小模块做演示。
强烈推荐读一下项目的cookbook目录中提供了大量编写好的示例代码,需要的时候可以拿来直接用
兼容大部分的模型接口框架,模型随便换,一切你说了算。
推荐使用linux系统,windows也可以用,但是随时出现各种坑都需要自己解决。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19