微信扫码
添加专属顾问
我要投稿
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与自然语言生成的技术,通过检索外部知识库增强文本生成能力。
听起来有点复杂,我们不妨从为什么需要用到RAG开始。
▲RAG的大致流程
三、RAG流程
▲关键词检索的示例
使用各种不同的相似度算法(如欧氏距离、余弦等)进行数据检索的一种技术。简单理解,就是把问题Embedding为向量,去向量数据库中匹配与此问题相似度最高的几个内容片段。
相似度检索是RAG中常用的检索方式,接下来我们展开说说如何利用相似度检索完成RAG的整个过程。
首先对数据库中的内容进行处理,比方说:把非文本形式的数据转换为标准的纯文本数据。然后将知识内容进行分块,切分成更短的段落或句子,以便更有效地进行处理。其中知识分块的策略会对最终知识片段的检索起到重要的影响
▲知识切分
b)知识向量化存储
d)向量检索
被转换成向量的问题与向量数据库中存储的知识向量进行比较,找出与查询向量最相似的知识片段,这一步骤通常通过计算向量之间的距离(如余弦距离、欧氏距离等)来实现。
提取相似度得分最高的几个知识片段,这些内容可以作为额外的上下文信息,结合用户的原始提问构建成Prompt后,输入给大模型进行处理。
f)回答
将大模型输出的问题结果返回给用户。这个答案是从知识库中检索到的最相关信息生成,确保了准确性和相关性。
四、RAG存在的挑战
虽说 RAG 能够解决在大模型使用过程中遇到的部分问题,但它仍存在方方面的挑战,比如:
五、结语
作为AIGC应用方,通常以集成第三方向量数据库为主,这意味着把RAG技术应用在实际业务当中相对比较容易,但想做好仍然有很多的困难需要克服,每个步骤都有可能对最终效果产生影响。
下一篇文章,将通过一个案例与大家分享RAG在ToB Agent的探索与实践。
以上是笔者近阶段的学习与思考,希望能帮到你。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-22
文档解析主流开源工具全家桶及RAG中的文档目录解析PageIndex思路解析
2025-04-22
腾讯发布Conan-Embedding-V2,登顶MTEB中英榜单,性能更强、覆盖场景更广
2025-04-22
想让 FastGPT 更猛?试试 OceanBase 向量数据库吧!
2025-04-22
RAG应用必备!10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强?
2025-04-22
深度拆解RAGFlow分片引擎!3大阶段+视觉增强,全网最硬核架构解析
2025-04-22
国人AI IDE神器Trae+MCP实现知识库检索精度暴涨300%【喂饭级教程】
2025-04-22
理解 RAG 第二部分:经典 RAG 的工作原理
2025-04-22
18种RAG技术大比拼:谁才是检索增强生成的最佳选择?
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-22
2025-04-22
2025-04-20
2025-04-19
2025-04-18
2025-04-16
2025-04-14
2025-04-13