我要投稿

RAG 检索大升级：BM25 与 RRF 助力 LLMs 精准破局

发布日期：2024-08-20 08:19:39 浏览次数： 2625

作者：AI技术研习社

微信搜一搜，关注“AI技术研习社”

BM25（最佳匹配25）和RRF（倒数秩融合）是两种在检索增强生成（RAG）系统中用于改进大型语言模型（LLMs）检索步骤的技术。以下将详细介绍它们的工作原理及其在RAG流程中的作用。

BM25（最佳匹配25）

BM25是一种概率信息检索模型，它基于与查询的相关性对文档进行排名。作为传统TF-IDF模型的扩展，BM25在许多检索任务中表现出色，因此被广泛应用。

BM25的工作原理：

术语频率（TF）：指一个术语在文档中出现的次数。BM25通过考虑文档长度来调整这一指标，避免较长的文档由于术语频繁出现而被错误地赋予更高权重。
反向文档频率（IDF）：衡量一个术语在所有文档中出现的稀有程度。稀有术语会被赋予更高的权重，以反映其重要性。
规范化：根据文档长度进行调整，确保不同长度的文档之间可以公平比较。

在RAG中的应用：

索引：利用BM25对文档集合进行索引，预先计算术语频率和其他相关统计数据。
查询处理：当查询被发出时（例如，LLM需要额外的上下文信息），BM25根据与查询的相关性对每个文档进行评分。
排名：根据BM25评分对文档进行排序，并将评分最高的文档作为相关上下文供LLM使用。

RRF（倒数秩融合）

RRF是一种集成技术，能够将多个检索模型的结果组合在一起。尤其在不同检索模型各自擅长不同相关性方面的情况下，RRF非常有用。

RRF的工作原理：

排名组合：每个检索模型生成一个文档的排名列表。RRF通过基于文档在每个排名列表中的位置为其分配分数，将这些排名列表结合在一起。
分数计算：文档的最终分数通过RRF公式计算得到。

融合：根据RRF综合分数对文档进行重新排名，生成一个包含各模型优势的最终文档列表。

score = 0.0for q in queries: # loop over queries send to different search engines if d in result(q):score += 1.0 / ( k + rank(result(q), d))return score
# where# k is a ranking constant# q is a query in the set of queries# d is a document in the result set of q# result(q) is the result set of q# rank( result(q), d ) is d's rank within the result(q) starting from 1

def reciprocal_rank_fusion(queries, d, k, result_func, rank_func):    return sum([1.0 / (k + rank_func(result_func(q), d)) if d in result_func(q) else 0 for q in queries])

在RAG中的应用：

多模型使用：使用多个检索模型（例如BM25、神经检索模型）独立检索并对查询文档进行排名。
秩融合：应用RRF合并这些模型的排名列表，生成一个更为稳健的相关文档排名列表。
上下文检索：将RRF融合后的排名靠前的文档提供给LLM，以生成更准确且相关的响应。

在RAG中结合BM25和RRF

初始检索：首先使用BM25执行初始检索，利用其在基于术语相关性排名文档时的效率和有效性。
集成方法：将其他检索模型（如神经检索模型）与BM25结合使用。
秩融合：使用RRF将BM25与其他检索模型的排名结果结合，生成一个从多个相关性角度受益的最终文档列表。
增强生成：将RRF融合列表中排名靠前的文档输入到LLM中，以提高生成准确且上下文相关的响应的能力。

通过在RAG检索步骤中结合BM25和RRF，可以充分利用不同检索模型的优势，提升检索文档的整体质量和相关性，从而增强LLM生成精准响应的性能。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-16

基于大模型的智能问答场景解决方案——RAG提升召回率的关键

2025-10-16

用合成数据评测 RAG 系统：一份可直接上手的 DeepEval 实操指南

2025-10-16

2025 年 RAG 最佳 Reranker 模型

2025-10-16

HiRAG问答流程深入分析

2025-10-13

LightRAG × Yuxi-Know——「知识检索 + 知识图谱」实践案例

2025-10-13

PG用户福音｜一次性搞定RAG完整数据库套装

2025-10-12

任何格式RAG数据实现秒级转换！彻底解决RAG系统中最令人头疼的数据准备环节

2025-10-12

总结了 13 个顶级 RAG 技术

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

响应速度提升300%、检索准确率90%：RAG如何让企业知识“活”起来赚钱？

2025-08-05

从原理到落地：RAG 技术全解析，手把手教你搭建专属知识库

2025-09-02

优化 GraphRAG：LightRAG的三大改进

2025-08-18

RAG系统全景：架构详解与落地实践指南

2025-08-25

高质量AI知识库应用的前提：选对向量数据库

2025-08-25

一文搞懂大模型：何为深入理解RAG？

2025-08-25

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

RAG检索后如何应用更有效？

2025-08-28

大家都在问

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

RAG检索后如何应用更有效？

2025-08-28

一文搞懂大模型：何为深入理解RAG？

2025-08-25

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部