微信扫码
与创始人交个朋友
我要投稿
在RAG(Retrieval-Augmented Generation)检索环节中,主流的检索方法是基于向量的,即通过语义相关度匹配来实现。这项技术的核心在于将外部知识库中的文档分解成语义完整的段落或句子,然后将其转换成计算机能够理解的数字形式,也就是多维向量。同时,用户提出的问题也会经过相同的转换过程,生成对应的多维向量,以便进行语义匹配和检索。
计算机能够通过语义分析来识别用户问题与文本之间的细微相关性。例如,"猫追逐老鼠"和"小猫抓老鼠"之间的语义相关度会高于"猫追逐老鼠"和"我喜欢吃冰激凌"之间的相关度。RAG系统会利用这种语义匹配能力,找到与用户问题最相关的文本内容。一旦找到,这些文本内容将与用户问题一起作为上下文信息,提供给大型语言模型,以帮助模型更准确地理解和回答问题。
搜索缩写词或短语:如"RAG"或"RLHF"。
搜索ID:如"gpt-3.5-turbo"或"titan-xlarge-v1.01"。
精确匹配:如产品名称、姓名、产品编号。
少量字符匹配:用户习惯输入少量关键词进行搜索。(通过少量字符进行向量检索时效果非常不好,但很多用户恰恰习惯只输入几个关键词)
低频词汇匹配:低频词汇往往承载重要含义。(比如“你想跟我去喝奶茶吗?”这句话中的分词,“喝”“奶茶”会比“你”“想”“吗”在句子中承载更重要的含义)
混合检索是一个灵活的概念,它指的是将不同的搜索技术结合起来,以提高搜索效果。本文以向量检索和关键词检索的结合为例,但混合检索并不局限于此。例如,我们可以将知识图谱技术,它擅长检索实体关系,与向量检索技术相结合。
不同的检索系统各自擅长寻找文本(段落、语句、词汇)之间不同的细微联系,这包括了精确关系、语义关系、主题关系、结构关系、实体关系、时间关系、事件关系等。可以说没有任何一种检索模式能够适用全部的情景。混合检索通过多个检索系统的组合,实现了多个检索技术之间的互补。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-04-11
2024-08-21
2024-07-09
2024-08-13
2024-07-18
2024-10-25
2024-07-01
2024-06-17