我要投稿

英特尔FastRAG给你的Pipelines提提速

发布日期：2024-08-21 06:02:25 浏览次数： 2182

作者：哎呀AIYA

微信搜一搜，关注“哎呀AIYA”

FastRAG 是英特尔实验室为高效、优化的 RAG 管道而开发的研究框架。它融合了最先进的大型语言模型 (LLM) 和信息检索功能。fastRAG 旨在为研究人员和开发人员提供支持拥有一套全面的工具集，用于推进检索增强发展。

特点：

优化的 RAG：使用 SOTA 高效组件构建 RAG 管道，以提高计算效率。
针对 Intel 硬件进行了优化：利用 Intel 扩展 PyTorch （IPEX）、? Optimum Intel 和 ? Optimum-Habana，在 Intel® Xeon® 处理器和 Intel® Gaudi® AI 加速器上尽可能优化地运行。
可定制：fastRAG 是使用 Haystack 和 HuggingFace 构建的。fastRAG的所有组件都与Haystack100%兼容。

组件

有关fastRAG中各种独特组件的简要概述，涵盖了各种最先进的技术和框架：

实例展示

上篇文章我们介绍了量化后的向量模型，可以大幅提升cpu处理的吞吐量，下面代码展示了如何在rag系统中使用它：

from haystack.schema import Document
# example documents to indexexamples = [ "There is a blue house on Oxford Street.", "Paris is the capital of France.", "The first commit in fastRAG was in 2022"]
documents = []for i, d in enumerate(examples):documents.append(Document(content=d, id=i))document_store.write_documents(documents)
from fastrag.retrievers import QuantizedBiEncoderRetriever
model_id = "Intel/bge-small-en-v1.5-rag-int8-static"retriever = QuantizedBiEncoderRetriever(document_store=document_store, embedding_model=model_id)document_store.update_embeddings(retriever=retriever)

就是这么简单，一行代码融入到了整个流程中。

FastRAG怎么用

官方给了很多个使用的例子，教大家怎么使用，下面展示部分例子，并给出使用代码的地址：

使用量化组件进行高效的开放域问答

使用知识语料库生成可回答问题的答案。

检索使用基于BM25的词汇检索，或使用基于 PLAID互动的稠密向量检索；
排序使用Sentence Transformer 或 ColBERT 进行后期交互密集检索。我们还提供利用高度优化的量化重新排名器进行快速推理。

生成使用Fusion-in-Decoder

https://github.com/IntelLabs/fastRAG/blob/main/examples/plaid_colbert_pipeline.ipynb

基于LLM的检索增强生成

通过使用检索增强功能提升大型语言模型（LLM）的生成能力，您可以按照以下步骤操作：

定义检索流：这涉及创建一个包含相关信息的存储，以及一个或多个检索器/排名器，以检索最相关的文档或段落。
定义提示模板：设计一个模板，其中包含合适的上下文或指令，以及管道检索的查询和信息的占位符。这些占位符将在生成过程中动态填充。
从 LLM 请求生成：利用提示模板并将其传递给 LLM，允许它根据提供的上下文、查询和检索到的信息生成令牌。

https://github.com/IntelLabs/fastRAG/blob/main/examples/rag-prompt-hf.ipynb

使用 REPLUG 与 LLM 进行并行文档读取

使用 REPLUG：Retrieval-Augmented Black-Box Language Models 中引入的算法并行读取多个文档，以生成任何问题的答案。

https://arxiv.org/abs/2301.12652https://github.com/IntelLabs/fastRAG/blob/main/examples/replug_parallel_reader.ipynb

开放域摘要

根据自由文本输入和知识语料库总结主题。使用 BM25 或其他检索器
检索使用Sentence Transformers或其他排名器
生成使用提示，所有文档内容拼接和 FLAN-T5 生成模型"summarize: "

https://github.com/IntelLabs/fastRAG/blob/main/examples/od_summarization_pipeline.ipynb

如果对内容有什么疑问和建议可以私信和留言，也可以添加我加入大模型交流群，一起讨论大模型在创作、RAG和agent中的应用。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-12

OpenAI 无需向量化的RAG新范例：探索大模型时代的高效知识问答与模型选择之道

2025-07-11

Rag评估框架

2025-07-11

详解RAG评估指标与评估方法

2025-07-11

一文读懂GraphRAG：把知识图谱塞进RAG，AI从“聪明”走向“懂事”

2025-07-11

文档太长模型“吃不下”？试试这15种Chunking策略，轻松搞定RAG！

2025-07-10

Spring Ai RAG 技术让大模型回答更精准

2025-07-09

5分钟了解GraphRAG和Mem0

2025-07-09

AI大模型落地最后一公里：RAG？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

MCP与RAG，and 让我们用MCP的Tool莽穿一切！

2025-04-16

深度解读：LlamaIndex 实现 RAG 重排序的关键要点

2025-05-08

RAG进阶：Embedding Models嵌入式模型原理和选择

2025-04-23

RAG技巧与底层代码剖析

2025-06-06

深度拆解RAGFlow分片引擎之切片实现

2025-04-16

2025年GitHub上十大RAG框架深度解析：从技术原理到实战应用

2025-05-30

淘天⾃营质量技术AI智能体的实践和思考

2025-05-19

Open WebUI中调用RAGFlow的聊天机器人——适合构建个人和企业级知识问答助手

2025-04-14

RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析

2025-06-05

大家都在问

AI大模型落地最后一公里：RAG？

2025-07-09

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-07-01

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

你的RAG系统安全么？

2025-06-29

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB