微信扫码
添加专属顾问
我要投稿
文章提出了一种名为
G-RAG的方法,通过结合文档图和抽象意义表示(AMR)图来优化检索增强生成(RAG)系统中大型语言模型的回答质量,特别是在处理信息不全或上下文关联度较低的文档时。该方法旨在改善现有重排序技术对文档间连接利用不足的问题,从而减少过拟合并降低计算资源消耗,从而提高RAG系统的性能。
1.文档图的构建
问题-文档对,将问题和文档文本拼接后使用 AMR BART 解析生成AMR图。节点表示文档,边表示文档之间的共同概念。2.节点特征的生成
3.边特征的生成
共同节点数和共同边数,作为边的特征,并进行归一化处理。4.图神经网络的表示更新
聚合邻居节点的特征来更新每个节点的表示。5.重排序得分和训练损失
余弦相似度计算每个文档的重排序得分,并使用交叉熵损失函数和成对排名损失函数进行训练。成对排名损失函数能够更好地处理排名分数的平局情况。1.数据集
自然问题(NQ)和TriviaQA数据集进行实验。NQ数据集包含来自Google搜索查询的文本块,而TQA数据集包含来自 trivia和 quiz-league网站的问答对。2.模型细节
问题-文档对生成AMR图。2层图卷积网络(GCN)作为GNN模型,隐藏维度从{8, 64, 128}中选择,dropout率从{0.1, 0.2, 0.4}中选择,学习率从{5e-5, 1e-4, 5e-4}中选择。优化器,学习率5e-5至1e-4,批量大小5,总训练步数50k,每10k步评估一次。3.评估指标
1.重排序性能
优于现有方法。MRR达到了27.3,而BART的MRR为25.7;在TQA数据集上,G-RAG的MHits@10达到了42.9,而BART的MHits@10为38.5。2.PaLM 2评估
表现不如G-RAG。这可能是由于PaLM 2生成的相关性得分中存在大量平局,导致排名效果不佳。显著提高了重排性能。3.不同嵌入模型的比较
论文提出的G-RAG方法通过利用文档之间的连接关系和AMR信息,显著提高了RAG系统在ODQA任务中的性能。该方法不仅提高了文档的识别精度,还提出了新的评估指标来公平地评估各种排名场景。此外,研究还表明,即使在LLM时代,重排器模型设计在RAG中仍然具有重要意义。未来的研究方向包括设计更复杂的模型以更好地处理AMR信息,并将这些信息整合到节点和边特征中,以及微调预训练LLM以提高RAG系统的性能。
优点与创新
基于文档图的重新排序器G-RAG:该方法利用文档之间的连接信息来提高RAG的性能,特别是在文档与问题上下文连接较弱的
情况下。新的评估指标:为了更公平地评估各种排名场景,包括得分相同的排名情况,提出了Mean Tied Reciprocal Ranking(MTRR)和Tied Mean Hits@10(TMHit@10)两个新指标。不足与反思
关键QA
文档图的构建:G-RAG利用AMR图的信息为检索到的文档构建文档图。每个节点代表一个文档,每条边表示两个文档之间有共同的概念。通过消息传递机制更新边特征,从而捕捉文档之间的连接关系。
路径识别和节点概念提取:在生成节点特征时,G-RAG不仅使用文档文本,还结合了AMR信息。具体步骤包括路径识别(确定从“问题”节点出发的最短单源路径)和节点概念提取(从这些路径中提取节点概念),从而更全面地理解文档的语义信息。
边特征的利用:除了节点特征外,G-RAG还充分利用AMR图中无向边的特征,如共同节点数和共同边数。这些特征有助于捕捉文档之间的相似性和关联性。
路径识别和节点概念提取:通过路径识别和节点概念提取,G-RAG仅选择与文档最相关的AMR信息。具体来说,G-RAG从AMR图中提取最短单源路径上的节点概念,而不是将所有AMR信息都纳入节点特征中。
特征归一化:在计算边特征时,G-RAG对特征进行了归一化处理,以避免在图卷积操作中输出节点特征的规模过大。这种归一化处理有助于减少冗余信息的干扰。
节点表示更新:在图神经网络的节点表示更新中,G-RAG通过聚合邻居节点的特征来更新当前节点的表示,从而确保更新的特征中不包含冗余的AMR信息。
Mean Tied Reciprocal Ranking (MTRR):为了更公平地评估重排器的性能,特别是当存在排名平局时,G-RAG提出了MTRR指标。MTRR通过平均乐观排名和悲观排名来计算MRR,从而减少平局对评估结果的影响。
Tied Mean Hits@10 (TMHit@10):同样,针对排名平局的情况,G-RAG提出了TMHit@10指标。TMHit@10通过将命中数除以平局数来计算Top-10排名的命中率,从而更准确地评估重排器在平局情况下的性能。这些新的度量指标使得G-RAG能够更全面地评估重排器在各种排名场景下的表现,包括存在平局的情况。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-28
“生成幻觉”(Hallucination)和“知识时效性”不足引发的架构范式变革
2025-10-27
RAG优化技巧
2025-10-26
关于RAG系统在多轮对话中的问题改写(优化)方法—使用历史记录改写问题
2025-10-26
你的RAG知识库,真的“喂”对数据了吗?拆解dify分段策略,告别无效召回
2025-10-16
基于大模型的智能问答场景解决方案——RAG提升召回率的关键
2025-10-16
用合成数据评测 RAG 系统:一份可直接上手的 DeepEval 实操指南
2025-10-16
2025 年 RAG 最佳 Reranker 模型
2025-10-16
HiRAG问答流程深入分析
2025-09-15
2025-09-02
2025-08-05
2025-08-18
2025-08-25
2025-08-25
2025-08-25
2025-09-03
2025-08-20
2025-09-08
2025-10-04
2025-09-30
2025-09-10
2025-09-10
2025-09-03
2025-08-28
2025-08-25
2025-08-20