微信扫码
添加专属顾问
我要投稿
本文研究了Infineon技术人员和客户经理快速获取产品信息的需求,评估了新流行的RAG-Fusion方法。
RAG-Fusion
结合了检索增强生成(RAG)
和互惠排名融合(RRF)
,通过生成多个查询并使用互惠分数重新排序
文档,以提供更准确和全面的答案。然而,该方法面临的一个挑战是,当生成的查询与原始查询相关性不足时,答案可能会偏离主题。RAG已在多个知识密集型自然语言处理任务中取得显著成功,而RRF作为重新排序算法,通过为文档分配互惠排名并结合这些排名生成最终的重新排序列表,进一步提升了信息检索的准确性。
论文提出了RAG-Fusion方法,用于解决快速获取产品信息的问题。具体来说,
传统的RAG聊天机器人首先收集产品文档并将其转换为文本,然后创建文本的向量嵌入并存存储在向量数据库中。当接收到用户查询时,机器人检索与原始查询最相关的n个文档,并将这些文档与查询一起发送给大型语言模型以生成响应。
RAG-Fusion在RAG的基础上增加了一些步骤。
生成多个新的搜索查询
。例如,如果用户的原始查询是“Tell me about MEMs microphones”,生成的查询可能包括“What are MEMs microphones and how do they work?”,“What are the advantages of using MEMs microphones?”,“What are some recommended MEMs microphones?”向量搜索
以找到多个相关文档,而不是将这些文档与查询一起发送给大型语言模型生成输出,而是执行互惠排名融合
。互惠排名融合算法为每个文档分配一个互惠排名分数,公式如下:其中,rank是按距离排序的文档当前排名,k是一个常数平滑因子,用于确定给定排名的权重。每次计算分数时,rrf分数与同一文档的前一个分数累积,当所有分数累积完毕时,文档被融合在一起并按其分数重新排序。
RAG-Fusion聊天机器人在回答技术问题时表现出色,能够提供准确且全面的答案。例如,对于查询“IP rating of mounted IM72D128”,机器人提供了详细的IP57评级的解释及其耐用性的相关信息。
RAG-Fusion聊天机器人在生成销售策略方面表现最佳,能够结合产品知识和逻辑生成有价值的策略。例如,对于查询“How do I sell a 100V OptiMOS Linear FET for power over ethernet to my customer?”,机器人提供了技术规格、市场趋势和客户偏好的信息,并建议突出产品的价值主张。
RAG-Fusion聊天机器人在回答客户问题时也表现良好,能够提供全面且有帮助的信息。例如,对于查询“Is the IM72D128 microphone good to use in an outdoor surveillance camera?”,机器人提供了详细的IP57评级和音频捕获能力的信息,强调了其在户外监控摄像头中的适用性。
本文提出的RAG-Fusion方法在提供准确且全面的答案方面优于传统的RAG模型,适用于工程师的技术问题、销售团队的销售策略问题和客户的客户相关问题。尽管RAG-Fusion增加了答案的质量,但也面临着运行时间较长、答案偏离主题和需要适当的提示工程等挑战。未来的研究方向包括扩展聊天机器人的语言支持、改进多模态PDF数据表的文本表示以及优化实时性能和提高自动化质量保证。
RAG-Fusion方法通过将原始查询发送给大型语言模型来生成多个新的搜索查询。这些生成查询的目的是从不同角度探索原始查询的主题,从而提高答案的准确性和全面性。为了确保生成查询的相关性,RAG-Fusion模型会考虑原始查询的关键词和上下文,生成与这些关键词和上下文相关的查询。此外,模型还可以通过预定义的规则和启发式方法来引导查询的生成,以确保它们与原始查询的高度相关性。
互惠排名融合(RRF)是一种重新排序算法,它为来自多个来源的文档分配互惠排名分数,然后将这些分数和文档结合起来生成最终的重新排序列表。具体来说,RRF算法的工作原理如下:
RRF算法通过综合考虑多个来源的文档排名,提高了答案的准确性和全面性。因为它不仅依赖于单一来源的文档排序,还结合了多个来源的排名信息,从而减少了因单一来源的局限性导致的偏差。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-07
r1-reasoning-rag:一种新的 RAG 思路
2025-03-05
提高企业 RAG 准确性的分步指南
2025-03-05
DeepSeek-R1 x Agentic RAG:构建带"深度思考"开关的知识研究助理|深度长文
2025-03-05
通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统
2025-03-05
本地部署DeepSeek R1 + Ollama + XRAG:三步搭建RAG系统,并解锁全流自动化评测
2025-03-05
Graph RAG 迎来记忆革命:“海马体”机制如何提升准确率?
2025-03-04
Windows 部署 DeepSeek 本地 RAG 保姆教程:低配秒变AI工作站,断网也能稳如老狗!
2025-03-04
DeepSearcher深度解读:Agentic RAG的出现,传统RAG的黄昏
2024-09-04
2024-10-27
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-03-05
2025-03-03
2025-03-02
2025-02-28
2025-02-24
2025-02-23
2025-02-15
2025-02-12