微信扫码
与创始人交个朋友
我要投稿
01
—
为什么需要重排序
02
—
重排序不仅适用于不同检索结果的合并,而且适用于单一检索模型下,引入重排序模型也能有效提升和改进文档召回的效果,如我们在关键词检索之后加入重排序模型,可以有效提升关键词召回的精确度和语义相关性。
重排序模型可以计算问题和文档列表之间的相关性得分,如果将它用于直接计算问题和大量文档的相关性,效率非常低,因此大多数情况下重排序主要出现在单一检索后的流程中以及混合检索后合并的流程中。
在具体的产品方案落地中,还需要考虑大模型输入上下文的大小限制,如百度文心一言,上下文窗口限制为4K Tokens限制,一般大模型的限制 是4K、8K、16K、128K的Tokens限制。因此在重排序模型中会限制传给大模型的分段个数,即TopK。当大模型的上下文窗口限制足够大时,过多的召回分段会可能引起召回内容的相关度降低,导致生成的答案质量下降,因此在设置TopK时不是越大越好,需要结合业务场景进行设置。
引入重排序是对现有RAG系统的一种增强,无需进行重大改造,以一种简单且低复杂度的方式改善RAG系统的回答效果。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-04-25
2024-05-14
2024-07-18
2024-04-26
2024-08-13
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19