微信扫码
与创始人交个朋友
我要投稿
文章提出了一种名为
G-RAG
的方法,通过结合文档图和抽象意义表示(AMR)图来优化检索增强生成(RAG)系统中大型语言模型的回答质量,特别是在处理信息不全或上下文关联度较低的文档时。该方法旨在改善现有重排序
技术对文档间
连接利用不足的问题,从而减少过拟合并降低计算资源消耗,从而提高RAG系统的性能。
1.文档图的构建
问题-文档对
,将问题和文档文本拼接后使用 AMR BART 解析生成AMR图。节点
表示文档
,边
表示文档之间的共同概念
。2.节点特征的生成
3.边特征的生成
共同节点数
和共同边数
,作为边的特征,并进行归一化处理。4.图神经网络的表示更新
聚合邻居节点
的特征来更新每个节点的表示。5.重排序得分和训练损失
余弦相似度计算
每个文档的重排序得分,并使用交叉熵损失函数
和成对排名损失函数
进行训练。成对排名损失函数能够更好地处理排名分数的平局情况
。1.数据集
自然问题(NQ)
和TriviaQA
数据集进行实验。NQ数据集包含来自Google搜索查询的文本块,而TQA数据集包含来自 trivia和 quiz-league网站的问答对。2.模型细节
问题-文档对
生成AMR图。2层
图卷积网络(GCN)作为GNN模型,隐藏维度
从{8, 64, 128}中选择,dropout率
从{0.1, 0.2, 0.4}中选择,学习率
从{5e-5, 1e-4, 5e-4}中选择。优化器
,学习率5e-5至1e-4,批量大小5,总训练步数50k,每10k步评估一次。3.评估指标
1.重排序性能
优于
现有方法。MRR
达到了27.3,而BART的MRR为25.7;在TQA数据集上,G-RAG的MHits@10
达到了42.9,而BART的MHits@10为38.5。2.PaLM 2评估
表现不如G-RAG
。这可能是由于PaLM 2生成的相关性得分中存在大量平局,导致排名效果不佳。显著提高
了重排性能。3.不同嵌入模型的比较
论文提出的G-RAG方法通过利用文档之间
的连接关系和AMR信息,显著提高了RAG系统在ODQA任务
中的性能。该方法不仅提高了文档的识别精度,还提出了新的评估指标来公平地评估各种排名场景。此外,研究还表明,即使在LLM时代,重排器模型
设计在RAG中仍然具有重要意义。未来的研究方向包括设计更复杂的模型以更好地处理AMR信息,并将这些信息整合到节点和边特征中,以及微调预训练LLM以提高RAG系统的性能
。
优点与创新
基于文档图的重新排序器G-RAG
:该方法利用文档之间的连接信息来提高RAG的性能,特别是在文档与问题上下文连接较弱的
情况下。新的评估指标
:为了更公平地评估各种排名场景,包括得分相同的排名情况,提出了Mean Tied Reciprocal Ranking(MTRR)和Tied Mean Hits@10(TMHit@10)两个新指标。不足与反思
关键QA
文档图的构建:G-RAG利用AMR图的信息为检索到的文档构建文档图。每个节点代表一个文档,每条边表示两个文档之间有共同的概念。通过消息传递机制更新边特征,从而捕捉文档之间的连接关系。
路径识别和节点概念提取:在生成节点特征时,G-RAG不仅使用文档文本,还结合了AMR信息。具体步骤包括路径识别(确定从“问题”节点出发的最短单源路径)和节点概念提取(从这些路径中提取节点概念),从而更全面地理解文档的语义信息。
边特征的利用:除了节点特征外,G-RAG还充分利用AMR图中无向边的特征,如共同节点数和共同边数。这些特征有助于捕捉文档之间的相似性和关联性。
路径识别和节点概念提取:通过路径识别和节点概念提取,G-RAG仅选择与文档最相关的AMR信息。具体来说,G-RAG从AMR图中提取最短单源路径上的节点概念,而不是将所有AMR信息都纳入节点特征中。
特征归一化:在计算边特征时,G-RAG对特征进行了归一化处理,以避免在图卷积操作中输出节点特征的规模过大。这种归一化处理有助于减少冗余信息的干扰。
节点表示更新:在图神经网络的节点表示更新中,G-RAG通过聚合邻居节点的特征来更新当前节点的表示,从而确保更新的特征中不包含冗余的AMR信息。
Mean Tied Reciprocal Ranking (MTRR):为了更公平地评估重排器的性能,特别是当存在排名平局时,G-RAG提出了MTRR指标。MTRR通过平均乐观排名和悲观排名来计算MRR,从而减少平局对评估结果的影响。
Tied Mean Hits@10 (TMHit@10):同样,针对排名平局的情况,G-RAG提出了TMHit@10指标。TMHit@10通过将命中数除以平局数来计算Top-10排名的命中率,从而更准确地评估重排器在平局情况下的性能。这些新的度量指标使得G-RAG能够更全面地评估重排器在各种排名场景下的表现,包括存在平局的情况。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-22
RAG技术在实际应用中的挑战与解决方案
2024-11-22
从普通RAG到RAPTOR,10个最新的RAG框架
2024-11-22
如何使用 RAG 提高 LLM 成绩
2024-11-21
提升RAG性能的全攻略:优化检索增强生成系统的策略大揭秘 | 深度好文
2024-11-20
FastGraphRAG 如何做到高达 20%优化检索增强生成(RAG)性能优化
2024-11-20
为裸奔的大模型穿上"防护服":企业AI安全护栏设计指南
2024-11-20
RAG-Fusion技术在产品咨询中的实践与分析
2024-11-19
构建高性能RAG:文本分割核心技术详解
2024-07-18
2024-05-05
2024-07-09
2024-07-09
2024-05-19
2024-06-20
2024-07-07
2024-07-07
2024-07-08
2024-07-09
2024-11-06
2024-11-06
2024-11-05
2024-11-04
2024-10-27
2024-10-25
2024-10-21
2024-10-21