微信扫码
与创始人交个朋友
我要投稿
本文研究了Infineon技术人员和客户经理快速获取产品信息的需求,评估了新流行的RAG-Fusion方法。
RAG-Fusion
结合了检索增强生成(RAG)
和互惠排名融合(RRF)
,通过生成多个查询并使用互惠分数重新排序
文档,以提供更准确和全面的答案。然而,该方法面临的一个挑战是,当生成的查询与原始查询相关性不足时,答案可能会偏离主题。RAG已在多个知识密集型自然语言处理任务中取得显著成功,而RRF作为重新排序算法,通过为文档分配互惠排名并结合这些排名生成最终的重新排序列表,进一步提升了信息检索的准确性。
论文提出了RAG-Fusion方法,用于解决快速获取产品信息的问题。具体来说,
传统的RAG聊天机器人首先收集产品文档并将其转换为文本,然后创建文本的向量嵌入并存存储在向量数据库中。当接收到用户查询时,机器人检索与原始查询最相关的n个文档,并将这些文档与查询一起发送给大型语言模型以生成响应。
RAG-Fusion在RAG的基础上增加了一些步骤。
生成多个新的搜索查询
。例如,如果用户的原始查询是“Tell me about MEMs microphones”,生成的查询可能包括“What are MEMs microphones and how do they work?”,“What are the advantages of using MEMs microphones?”,“What are some recommended MEMs microphones?”向量搜索
以找到多个相关文档,而不是将这些文档与查询一起发送给大型语言模型生成输出,而是执行互惠排名融合
。互惠排名融合算法为每个文档分配一个互惠排名分数,公式如下:其中,rank是按距离排序的文档当前排名,k是一个常数平滑因子,用于确定给定排名的权重。每次计算分数时,rrf分数与同一文档的前一个分数累积,当所有分数累积完毕时,文档被融合在一起并按其分数重新排序。
RAG-Fusion聊天机器人在回答技术问题时表现出色,能够提供准确且全面的答案。例如,对于查询“IP rating of mounted IM72D128”,机器人提供了详细的IP57评级的解释及其耐用性的相关信息。
RAG-Fusion聊天机器人在生成销售策略方面表现最佳,能够结合产品知识和逻辑生成有价值的策略。例如,对于查询“How do I sell a 100V OptiMOS Linear FET for power over ethernet to my customer?”,机器人提供了技术规格、市场趋势和客户偏好的信息,并建议突出产品的价值主张。
RAG-Fusion聊天机器人在回答客户问题时也表现良好,能够提供全面且有帮助的信息。例如,对于查询“Is the IM72D128 microphone good to use in an outdoor surveillance camera?”,机器人提供了详细的IP57评级和音频捕获能力的信息,强调了其在户外监控摄像头中的适用性。
本文提出的RAG-Fusion方法在提供准确且全面的答案方面优于传统的RAG模型,适用于工程师的技术问题、销售团队的销售策略问题和客户的客户相关问题。尽管RAG-Fusion增加了答案的质量,但也面临着运行时间较长、答案偏离主题和需要适当的提示工程等挑战。未来的研究方向包括扩展聊天机器人的语言支持、改进多模态PDF数据表的文本表示以及优化实时性能和提高自动化质量保证。
RAG-Fusion方法通过将原始查询发送给大型语言模型来生成多个新的搜索查询。这些生成查询的目的是从不同角度探索原始查询的主题,从而提高答案的准确性和全面性。为了确保生成查询的相关性,RAG-Fusion模型会考虑原始查询的关键词和上下文,生成与这些关键词和上下文相关的查询。此外,模型还可以通过预定义的规则和启发式方法来引导查询的生成,以确保它们与原始查询的高度相关性。
互惠排名融合(RRF)是一种重新排序算法,它为来自多个来源的文档分配互惠排名分数,然后将这些分数和文档结合起来生成最终的重新排序列表。具体来说,RRF算法的工作原理如下:
RRF算法通过综合考虑多个来源的文档排名,提高了答案的准确性和全面性。因为它不仅依赖于单一来源的文档排序,还结合了多个来源的排名信息,从而减少了因单一来源的局限性导致的偏差。
『老贾探AI
』主要关注LLM、RAG、智能文档
等技术方向,并持续提供AI行业热点资讯、精选论文解读
。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-20
FastGraphRAG 如何做到高达 20%优化检索增强生成(RAG)性能优化
2024-11-20
为裸奔的大模型穿上"防护服":企业AI安全护栏设计指南
2024-11-19
构建高性能RAG:文本分割核心技术详解
2024-11-19
【RAG竞赛获奖方案】CCF第七届AIOps国际挑战赛季军方案分享EasyRAG:一个面向AIOps的简洁RAG框架
2024-11-19
企业RAG构建中,如何用“行级别权限管控”避免数据泄露
2024-11-19
大模型prompt压缩技术总结:从硬提示到软提示代表方案实现思路
2024-11-19
Lilian Weng 大模型幻觉问题解读 | 检测方法
2024-11-19
1.2kStar RAG2.0具备超长记忆,实现全局检索
2024-07-18
2024-05-05
2024-07-09
2024-07-09
2024-05-19
2024-06-20
2024-07-07
2024-07-07
2024-07-08
2024-07-09
2024-11-06
2024-11-06
2024-11-05
2024-11-04
2024-10-27
2024-10-25
2024-10-21
2024-10-21