微信扫码
与创始人交个朋友
我要投稿
现有RAG设计和评估方法,没有方案或评估方法明确针对具有多方面性的问题。下面解释一下多方面性的问题:"多方面性的问题"是指那些需要理解和整合多个不同领域或主题的知识和信息才能得到完整和准确回答的问题。这类问题的特点在于它们涉及的内容跨度广,可能包括但不限于以下几个方面:
多样性的主题:问题可能涉及多个不同的主题或领域,例如,一个关于历史事件的问题可能同时关联到政治、社会、经济和技术等多个方面。
复杂的关系:问题中的不同方面之间可能存在复杂的相互关系,需要对这些关系有深入的理解才能准确回答。
多源信息:为了回答这类问题,可能需要从多个不同的信息源或文档中检索和整合数据。
综合回答:需要对检索到的信息进行综合分析,以形成一个全面、准确的回答。
例如,考虑一个问题:“亚历山大大帝是如何影响现代汽车工业的?” 这个问题本身就是高度多方面性的,因为它涉及到古代历史(亚历山大大帝)和现代技术(汽车工业)。要准确回答这个问题,可能需要检索和整合关于亚历山大大帝的历史资料、关于汽车工业的发展史,以及两者之间可能存在的间接联系等多个方面的信息。MRAG的设计使其能够更好地处理这种类型的问题。
这类问题需要在单个查询中结合多个显著不同的方面,这在现有RAG方案中尚未得到解决。文章提出了MRAG,通过利用Transformer的多头注意力层的激活来解决上述问题,而不是使用传统的解码器层激活。作者认为,不同的注意力头可以捕获数据的不同方面,从而在不增加存储需求的情况下,提高对复杂多方面查询的检索准确性。
在MRAG中,解码器的输入是一个由个token组成的文本块。解码器的输出是每个attention head对第个token 的输出。
注意力头输出: 对于第个token ,第h个attention head的输出定义为:
其中,权重 是通过softmax函数计算得到的:
这里, 是与head h 相关联的可学习query向量, 是第j个token的可学习key向量,是第j个token的可学习value向量。是key向量的维度,用于softmax的缩放,防止梯度消失或爆炸。
多头注意力输出: 所有attention head的输出被合并,形成第个token的多头注意力输出 :
这里, 是一个线性层,用于合并所有attention heads的输出结果。
前馈层: 多头注意力的输出随后会通过一个前馈神经网络层进一步处理。
在标准RAG中,嵌入是通过以下步骤生成的:
MRAG的关键思想是使用最后一个attention层生成的多个激活向量,而不是仅使用最后一个feed-forward解码器层的输出。具体来说:
对于最后一个token ,生成一组嵌入 :
其中 是第个头在最后一个token 上的输出。
这种方法允许MRAG捕获输入数据的多个方面,因为不同的attention heads可能专注于数据的不同特征。
MRAG流程由两个主要部分组成:数据准备(Data Preparation)和查询执行(Query Execution)。这两部分都依赖于一个数据存储(Data Store),它是一个向量数据库,用于存储文档或文本片段的嵌入表示。
数据准备阶段的目的是填充数据存储,使其包含多方面MRAG文本嵌入及其对应的文档或文本片段。
查询执行阶段的目的是使用MRAG处理用户查询,并检索最相关的文档或文本片段。
MRAG在数据存储中以不同于标准RAG的方式存储数据。在MRAG中,每个多方面嵌入由多个单方面嵌入组成,每个单方面嵌入都指向原始文本片段。这意味着数据存储包含多个嵌入空间,每个空间捕获文本的不同方面。
MRAG的检索策略包括以下步骤:
重要性评分:为所有嵌入空间分配重要性分数,以反映不同空间的相关性。
该算法基于经验启发式方法,旨在评估每个注意力头的相关性。 表示头 的“重要性”,L2范数越大,表示头 越重要。 作为衡量嵌入空间“分散度”的代理,余弦距离越大,表示嵌入空间中向量之间的分散度越高。通过计算 和 的乘积,算法奖励那些具有高平均关注度和高平均分散度的头,同时惩罚那些具有低关注度或低分散度的头。
传统RAG检索:对每个嵌入空间分别应用传统RAG检索,返回每个空间中最接近的文本片段列表。
投票策略:使用投票策略从所有嵌入空间返回的文本片段列表中选择最佳的k个文本片段。这个策略结合了嵌入空间的重要性分数和文本片段在列表中的位置。
标准RAG(Retrieval-Augmented Generation)和Multi-Head RAG(MRAG)都是为了增强大型语言模型(LLMs)能力的框架,但它们在实现方式上存在一些关键差异。下面对标准RAG和MRAG的对比做个小总结:
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-21
OpenAI 新 AI 逼近人类智力!一文读懂最新突破与技术原理
2024-12-21
OpenAI o3开启推理scaling,迈向AGI新时代
2024-12-21
手把手教你打造通用型LLM智能体,一文读懂核心原理!
2024-12-21
o3比o1强在哪里?
2024-12-21
AI Agent智能体产品的5个级别
2024-12-21
OpenAI 铺垫了12天发布的 o3 到底咋样?
2024-12-21
昨天,Google 发布了两个重磅的 AI 生成模型
2024-12-21
对话面壁智能刘知远:Densing Law是大模型能力的另一个度量衡|甲子光年
2024-05-28
2024-04-26
2024-08-13
2024-08-21
2024-07-09
2024-04-11
2024-08-04
2024-06-13
2024-07-18
2024-07-01
2024-12-21
2024-12-21
2024-12-21
2024-12-16
2024-12-06
2024-12-03
2024-12-01
2024-11-29