支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


从RAG到KAG,认识知识增强生成技术的演进(上)

发布日期:2025-04-28 07:26:50 浏览次数: 1560 作者:7sh科技
推荐语

深入解析知识增强生成技术,洞悉RAG与KAG的演进路径。

核心内容:
1. RAG技术局限性与KAG创新架构
2. 知识检索模糊性与逻辑推理能力不足
3. KAG在专业领域问答中的应用效果与未来趋势

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

检索增强生成 RAG 和 知识增强生成 KAG 代表了当前大模型与外部知识结合的两代技术范式。随着大模型在专业领域的应用深入,传统 RAG 技术暴露出诸多局限性,而KAG作为新一代框架,通过深度融合 知识图谱 与 大语言模型,显著提升了专业领域问答的 准确性、逻辑性和可解释性

今天的这篇文章将系统分析RAG的局限性、KAG的创新架构、两者核心技术对比、实际应用效果以及未来发展趋势,希望能帮助您全面理解这一技术演进的内在逻辑与 实用价值

RAG技术的局限性

RAG 技术自提出以来,已成为连接大语言模型与外部知识的 重要桥梁,但在专业领域应用中逐渐暴露出 多方面的不足。理解这些局限性是认识 KAG 价值的前提。

① 知识检索的模糊性是RAG最根本的问题。

RAG依赖向量相似度进行检索,而语义相似并不等同于知识相关。在专业领域中,许多问题需要精确匹配专业术语和概念,向量检索常会返回语义相近但知识无关的内容。

例如,在法律领域查询"过失致人死亡罪的量刑标准",可能会检索到关于"故意杀人罪"的内容,因为两者在向量空间中的位置接近。这种"近似而非精确"的检索机制导致专业领域回答的准确率大幅下降。

② 逻辑推理能力薄弱是另一大缺陷。

RAG本质上仍基于大语言模型的 next-token预测机制,对需要数值计算、时间序列分析或复杂逻辑推理的问题表现不佳。测试显示,传统RAG仅能解决企业知识库中约16%的问题,特别是对需要多步推理的复杂问题几乎无能为力。

例如:医疗领域中的"根据患者连续三次检查的指标变化趋势判断病情发展"这类问题,RAG系统往往难以给出符合医学逻辑的准确分析。

③ 多跳问答的级联错误在复杂查询中尤为明显。

当问题需要串联多个知识点时,这一过程中任何一环的检索错误都会导致最终答案偏离正确方向。而RAG缺乏对各跳检索结果的逻辑校验机制,错误会不断累积

例如"某药物相互作用导致副作用增加的机制",RAG需要先检索药物A的特性,再检索药物B的特性,最后分析相互作用。

④ 知识更新与一致性问题也制约着RAG的表现。

专业领域的知识更新频繁且需要严格一致性,如:临床指南的修订或法律条款的更新。RAG系统难以保证所有相关文本块同步更新,可能导致同一问题在不同文档块中得到 矛盾的信息

⑤ 领域适应性差和领域特定逻辑的处理不足。

金融领域的复利计算法律领域的条文援引规则 等专业知识,仅靠通用语言模型难以准确把握。蚂蚁集团在电子政务问答中发现,传统RAG对政府服务流程、材料要求等问题的回答专业度不足。

表:RAG在不同类型问题上的表现对比

问题类型 示例 RAG适用性 主要挑战
显性事实查询 "2016年奥运会在哪里举办?" 优秀 检索精度优化
隐性事实查询 "过去一个月营收增长率最高的门店" 一般 多步检索与计算
可解释推理 "华南区域营收下滑5%的原因?" 较差 业务规则整合
隐性推理 "IT系统故障的根本原因分析" 几乎无效 逻辑挖掘与归纳

这些局限性促使业界探索更强大的 知识增强方案KAG 正是在这样的背景下应运而生,通过知识图谱与大模型的 双向增强,系统性地解决了上述问题。

篇幅有限,下期内容接着聊,重点分析 KAG框架的核心创新。

往期推荐:
1. GPT 4.1重磅升级!它有多强?3分钟带你看完最新特性
2. MCP协议爆火后,A2A协议又是什么?解决什么问题?" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">继MCP协议爆火后,A2A协议又是什么?解决什么问题?
3. RAG技术的三大难题与应对方案:切片策略、检索策略、全局观策略

好了,本期内容就是这么多,希望能够帮助到您,感谢您能读到最后,如果觉得内容不错,请您点赞转发给予鼓励,咱们下期再见。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询