我要投稿

大模型+RAG如何提高问答准确率？5家互联网大厂RAG落地实践

发布日期：2024-09-18 08:35:36 浏览次数： 2378 作者：沙丘社区

RAG（Retrieval-Augmented Generation，检索增强生成）是当前最流行的基于大模型的系统架构，很多大模型应用几乎完全基于RAG构建。RAG的本质是在大模型交互之前提前进行搜索，召回正确的上下文给到大模型，决定了大模型生成的天花板。

RAG方法使用搜索引擎来快速定位和检索构建提示所需的任何信息，具体流程如下：

· 使用大模型来重构原始的用户提示，使其与后续步骤中搜索引擎所要求的格式兼容；

· 根据重构后的提示进行搜索，这种搜索可以基于多种知识表示或方法，包括知识图谱、向量数据库等；

· 将大模型用于总结修改过的提示中包含的信息，并生成流畅的、类似人类语言的回复；

· 在最终用户看到由大模型生成的响应之前，“响应验证”会对其准确性和安全性进行监控和检查。

当前，从使用场景上看，RAG主要使用的场景有两种——聊天机器人和智能检索。其中聊天机器人是会话场景、一问一答聊天交互，而智能检索更像是copilot场景，基于搜索结果进一步解读和分析，辅助工作场景。智能检索相较于chatbot对大模型幻觉问题的容忍程度更高。

沙丘智库长期跟踪调研大模型技术的发展，旨在帮助企业快速了解大模型最新、最全面的落地情况。沙丘智库通过研究火山引擎、阿里云、字节跳动、哔哩哔哩、蚂蚁集团基于“大模型+RAG”的智能问答系统建设实践，旨在为其他企业提供参考。

▎案例1：火山引擎基于大模型的智能问答实践

火山引擎基于RAG技术实现智能问答，RAG通过从外部知识源动态检索信息，并使用检索到的数据作为组织答案的参考，显著提高响应的准确性和相关性，有效解决大模型中存在的幻觉问题。

RAG方案实现的核心在于两点，一是在检索阶段做到比较高的topk召回率，分为两路召回，一路是通过倒排索引检索召回，另一路是通过向量化方式召回，两路召回需要混排；二是支持比较大的context window，并能从较多相关信息中总结出正确答案。

完整内容：火山引擎基于大模型的智能问答实践

▎案例2：阿里云基于RAG的智能问答实践

阿里云通过RAG技术，解决了智能问答中遇到的幻觉问题、知识更新缓慢、隐私数据泄露和高昂的训练成本等挑战。RAG方案通过外挂知识库提供可靠知识，优化了知识检索和答案生成流程，提高了智能问答的准确性和效率。

完整内容：阿里云基于RAG的智能问答实践

▎案例3：字节跳动答疑机器人场景大模型实践

研发基建部门日常需要安排答疑值班，回答用户关于基建相关的咨询，字节跳动将研发答疑场景作为切入点，利用大模型构建答疑机器人，并联动研发领域沉淀多年的知识积累，答疑机器人充分利用RAG和FineTuning两种建设思路的优势。

完整内容：字节跳动答疑机器人场景大模型实践

▎案例4：哔哩哔哩智能客服场景大模型实践

哔哩哔哩通过大模型升级智能客服系统，优化RAG链路和检索机制，提升了对话的时效性和准确性。构建了全面的领域知识库，实现了高效知识检索和准确安全的回答。实践结果显示，智能客服拦截率提升了近30%，显著改善了用户体验。

完整内容：哔哩哔哩智能客服场景大模型实践

▎案例5：检索增强在知识搜索场景的应用实践

蚂蚁集团采用检索增强技术，通过知识库分层构建、复杂文档处理、混合搜索策略和总结模型优化，有效提升了大模型在知识搜索场景中的应用效果，这项技术在企业内部多个场景中得到应用，相比传统搜索，答案获取效率提高了约20%。

完整内容：检索增强在知识搜索场景的应用实践

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-16

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

超越 RAG 的 AI 记忆增强：在 2025 年加速对话代理的上下文理解

2025-04-16

深度拆解RAGFlow分片引擎之切片实现

2025-04-16

OneFileLLM：一键整合海量数据源

2025-04-16

强强联合！LangChain与CrewAI构建基于RAG的智能查询解答系统

2025-04-16

向量嵌入四种实现方式

2025-04-15

Cloudflare AutoRAG：把RAG应用变得和安装微信一样简单

2025-04-15

RAG优化策略总结

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

RAG系统中的“幕后英雄”：重排器如何提升信息检索的精准度？

2025-04-14

Dify 基础篇| 深度解读 RAG：为什么需要混合检索？

2025-04-13

OlmOCR如何成为搭建RAG 知识库的"智能中枢"？

2025-04-11

构建Agentic RAG 系统的方法有哪些？

2025-04-09

【AI知识点】什么是Agentic RAG？

2025-04-07

从“人工智障”到“真智能”：AI智能体如何突破最后一道技术壁垒？

2025-04-05

有Embedding模型不够，还需要Rerank模型？

2025-04-04

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB