我要投稿

【深入浅出RAG】构建生产级RAG：通过LlamaIndex打造多租户的RAG系统

发布日期：2024-06-07 07:05:07 浏览次数： 3316

作者：AI模数师

微信搜一搜，关注“AI模数师”

RAG（检索器增强生成）系统中的多租户概念在数据安全性和隐私方面变得越来越重要。简单来说，多租户指的是系统能够独立且安全地为多个用户提供服务。

在企业中，不同的部门都有不同的权限，比如客服和销售。他们各自都有不同的文件，需要通过RAG进行查询，但是彼此不能看到对方的文件内容。

多租户的关键之处在于，当用户A查询系统时，他们应该只从他们索引的文档中获得答案，而不是从用户B索引的文档中获得答案，反之亦然。

这种分离对于维护数据保密性和安全性至关重要，因为它防止了不同用户之间私人信息的意外或未经授权的交叉引用。

在RAG系统多租户的背景下，这意味着设计一个系统不仅要有效理解并检索信息，而且还要严格遵守用户特定的数据边界。

每个用户与系统的交互都是隔离的，确保RAG流水线中的检索器组件只访问对特定用户相关且被允许的信息。这种方法在涉及敏感或专有数据的场景中非常重要，因为它防止了数据泄露和隐私侵犯。

解决多租户挑战

管理多租户的关键在于元数据。在索引文档时，我们在将其添加到索引之前，将用户特定信息纳入元数据中。这确保了每个文档都与一个单独的用户唯一绑定。

在查询阶段，检索器使用这些元数据来过滤并仅访问与查询用户相关联的文档。随后，它执行语义搜索以检索最相关的信息片段，或称为“top_k块”，供该用户使用。

通过实施这种方法，我们有效地防止了不同用户之间私人信息的未经授权的交叉引用，维护了每个用户数据的完整性和保密性。

接下来将通过一个示例，展示如何通过LlamaIndex实现多租户的RAG系统。通过两篇不同的论文分别让两个用户进行检索。

加载数据：

我们将为用户A 加载 “ LLMCompiler 论文” 的数据，为用户B 加载 “ Dense X Retrieval 论文 ” 的数据。


reader = SimpleDirectoryReader(input_files=['dense_x_retrieval.pdf'])documents_userA = reader.load_data()
reader = SimpleDirectoryReader(input_files=['llm_compiler.pdf'])documents_userB = reader.load_data()

创建空索引：

创建一个空索引，可以将文档插入其中，每个文档都带有包含用户信息的元数据标签。

index = VectorStoreIndex.from_documents(documents=[])

摄入管道：

摄入管道对于数据提取和执行转换非常有用，包括分块、元数据提取等。这里我们使用它来创建节点，然后将这些节点插入到索引中。

pipeline = IngestionPipeline(transformations=[SentenceSplitter(chunk_size=512, chunk_overlap=20),])

更新元数据并插入文档：

通过更新文档的元数据，为每个用户添加信息，并将文档插入到索引中。


for document in documents_userA:document.metadata['user'] ='userA'
nodes = pipeline.run(documents=documents_userA)
index.insert_nodes(nodes)
for document in documents_userB:document.metadata['user'] ='userB'
nodes = pipeline.run(documents=documents_userB)
index.insert_nodes(nodes)

定义查询引擎：

我们将为两个用户定义查询引擎，并设置必要的过滤器。


# 对于user AuserA_query_engine = index.as_query_engine(filters=MetadataFilters(filters=[ExactMatchFilter(key="user",                value="userA",)]),similarity_top_k=3)

# 对于userBuserB_query_engine = index.as_query_engine(filters=MetadataFilters(filters=[ExactMatchFilter(key="user",value="userB",)]),similarity_top_k=3)

查询：

# UserA拥有Dense X Retrieval论文，应该能够回答以下问题。response = userA_query_engine.query("what are propositions mentioned in the paper?")

论文提到命题作为替代的检索单元选择。命题被定义为文本中对应于文本中不同意义的原子表达式。它们是最小的，不能进一步分割成单独的命题。

每个命题都是自包含的，包括从文本中解释其含义所需的所有必要上下文。论文通过一个关于比萨斜塔的例子来演示命题的概念，其中段落被分成三个命题，每个命题对应于塔的一个不同事实。

# userB 拥有LLMCompiler论文response = userB_query_engine.query("what are steps involved in LLM Compiler?")

LLMCompiler 由三个关键组件组成：一个LLM规划器、一个任务获取单元和一个执行器。LLM规划器通过定义基于用户输入的不同函数调用及其依赖关系来确定执行流程。

任务获取单元在用前一个任务的实际输出替换变量后，调度可以并行执行的函数调用。最后，执行器使用相关工具执行调度的函数调用任务。这些组件协同工作，优化了LLM的并行函数调用性能。

# 这不应该被回答，因为userA没有关于LLMCompiler的信息response = userA_query_engine.query("what are steps involved in LLMCompiler?")
LLM：对不起，但我在给定的上下文中找不到有关LLMCompiler涉及的步骤的任何信息。

正如所演示的，如果 userA 查询 userB 索引的文档，系统不会从该文档检索到任何答案。

一键整合包

如果觉得上面的步骤太麻烦，在 LlamaPacks 中提供了一个 MultiTenancyRAGPack 的Python包，可以直接进行加载。

在数字化时代，数据安全和隐私保护是我们共同关注的焦点。RAG系统的多租户概念，不仅为我们提供了一个安全的数据环境，更是一种对用户隐私尊重的体现。通过精心设计的元数据管理和严格的数据隔离，我们能够确保每位用户的信息安全无虞。这不仅是技术的进步，更是对用户权益的坚守。

"随着技术的发展，我们如何进一步确保在享受智能服务的同时，个人隐私得到更好的保护？未来的RAG系统将如何平衡智能化与隐私权的界限？"