我要投稿

RAG开发系列

发布日期：2024-05-18 13:44:09 浏览次数： 2073 作者：alitrack

RAG开发系列

今天要介绍的是用DuckDB把向量保存到数据库，并增加一个UI，让它成为一个真正可以使用的RAG应用（当然还是雏形）。

向量数据库的选择很多，这里暂且不讨论它们的优劣性。

正文

安装包

pip install duckdb llama-index-vector-stores-duckdb

因为llamaindex已经帮你封装好了，引入DuckDB，只需要增加增加两行代码即可

代码


from llama_index.core import VectorStoreIndex, Document, SimpleDirectoryReader,Settings，StorageContext
from llama_index.llms.ollama import Ollama
from llama_index.embeddings.ollama import OllamaEmbedding
from llama_index.vector_stores.duckdb import DuckDBVectorStore

# 指定LLM
Settings.llm = Ollama(model="wizardlm2:7b-q5_K_M", request_timeout=60.0)
# 指定 embedding model
Settings.embed_model = OllamaEmbedding(model_name="snowflake-arctic-embed:latest")
## 剩下代码一样
documents = SimpleDirectoryReader("./data").load_data()
index = VectorStoreIndex.from_documents(documents)
chat_engine = index.as_chat_engine(chat_mode="condense_question", verbose=True)
print(chat_engine.chat("DuckDB的VSS扩展主要功能, reply in Chinese"))

加个UI

可选的UI框架很多，如streamlit， gradio， nicegui等等，今天介绍个streamlit的实现。

• 模型相关的部分封装在rag.py中

import os
import streamlit as st
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader,Settings
from llama_index.vector_stores.duckdb import DuckDBVectorStore
from llama_index.core import StorageContext

from llama_index.llms.ollama import Ollama
from llama_index.embeddings.ollama import OllamaEmbedding

@st.cache_resource
def init_model():
    Settings.llm = Ollama(model="wizardlm2:7b-q5_K_M", request_timeout=300.0)


    Settings.embed_model = OllamaEmbedding(model_name="snowflake-arctic-embed:latest")
    embed_dim=len(Settings.embed_model.get_query_embedding('hello'))
    return embed_dim



@st.cache_resource
def init_index(rebuild=False):
    embed_dim = init_model()
    if rebuild:
        documents = SimpleDirectoryReader("./data").load_data()
        os.remove('duckdb/rag.db')
        os.removedirs('duckdb')
        
        vector_store = DuckDBVectorStore(embed_dim=embed_dim,database_name="rag.db",persist_dir="duckdb")

        storage_context = StorageContext.from_defaults(vector_store=vector_store)
        index = VectorStoreIndex.from_documents(documents, storage_context=storage_context)
    else:
        vector_store = DuckDBVectorStore(embed_dim=embed_dim,database_name="rag.db",persist_dir="duckdb")
        index = VectorStoreIndex.from_vector_store(vector_store=vector_store)
    return index


@st.cache_resource
def init_engine():
    index = init_index(rebuild=True)
    chat_engine = index.as_chat_engine(chat_mode="condense_question", verbose=True)
    return chat_engine

• UI 部分main.py

import  streamlit as st
from rag import init_engine


def main():
    if "messages" not in st.session_state.keys():  # Initialize the chat messages history
        st.session_state.messages = [
            {"role": "assistant", "content": "I am rag bot!"}
        ]
    # print(chat_engine.chat("DuckDB的VSS扩展主要功能, reply in Chinese"))

    if "chat_engine" not in st.session_state.keys():  # Initialize the chat engine
        st.session_state.chat_engine = init_engine()

    # Prompt for user input and save to chat history
    if prompt := st.chat_input("Your question"):
        st.session_state.messages.append({"role": "user", "content": prompt})

    for message in st.session_state.messages:  # Display the prior chat messages
        with st.chat_message(message["role"]):
            st.write(message["content"])

    # If last message is not from assistant, generate a new response
    if st.session_state.messages[-1]["role"] != "assistant":
        with st.chat_message("assistant"):
            with st.spinner("Thinking..."):
                response = st.session_state.chat_engine.chat(prompt)
                st.write(response.response)
                message = {"role": "assistant", "content": response.response}
                # Add response to message history
                st.session_state.messages.append(message)

if __name__ == "__main__":        
    main()

效果图已经附上了。

或者需要的包

pip install llama-index-embeddings-ollama llama-index-llms-ollama llama-index-readers-file llama-index-vector-stores-duckdb duckdb streamlit

或者使用requirements.txt，代码在GitHub^[1]。

结论

目前只是出了个雏形，接下来还有很多工作要做，如：

• 配置模型选择，判断模型是否下载
• 指定chunksize
• 允许增量增加文档
• 解决streamlit 刷新聊天记录丢失的问题
• 聊天的历史导出
• Windows下基于embed版本Python的懒人包，类似我之前提供的Apache Superset 懒人包

引用链接

[1] GitHub: https://github.com/alitrack/rag

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

伪装成浏览器的 AI Agent，好用吗？

2025-04-26

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

从 MCP 到项目管理，为什么“开放”成了新风向？

2025-04-25

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB