支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


微软PIKE-RAG开源:解锁专业领域知识理解与推理,RAG新突破!

发布日期:2025-04-13 06:57:43 浏览次数: 1568 作者:马伟说
推荐语

微软PIKE-RAG技术突破,大幅提升专业领域知识理解和推理能力!

核心内容:
1. PIKE-RAG方法概述:专注于领域知识提取和应用,构建连贯思考逻辑
2. 针对现有RAG系统的三大问题:知识来源多样性、通用性不足、专业知识缺乏
3. PIKE-RAG框架与分阶段系统构建策略,灵活应对不同复杂性问题

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
近一年来,虽然检索增强生成(Retrieval Augmented Generation, RAG)系统在通过外部检索扩展大语言模型(LLMs)能力方面取得了一定的进展。但它主要依赖于文本检索和LLMs的理解能力,缺乏对多源数据知识的提取、理解和利用,尤其在专业知识较强的领域(如工业应用中)表现出显著的不足。
为了解决这一问题,微软亚洲研究院提出了 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)方法,一种”专注于提取、理解和应用领域特定知识,同时构建连贯的思考逻辑,以逐步引导 LLMs 获得准确的响应“的方法,旨在解决以下问题:
  • 1. 知识来源的多样性问题面对知识知识来源的多样性问题,PIKE-RAG旨在通过构建多层异构图来表示不同层次的信息和知识,从而更好地解决这一问题。

  • 2. 通用性与"一刀切"的问题:不同类型的问题(如简单事实问答与需要多步推理的复杂问题)要求不同的处理策略。现有的 RAG 方法未能充分考虑不同应用场景中的复杂性和特定需求,而采用统一流程,因此无法兼顾所有需求。通过任务分类系统能力分级,PIKE-RAG 提供了一种能力需求驱动的方案搭建策略,显著提高了系统在不同复杂性问题上的适应能力。

  • 3. LLMs 的领域专业知识不足:在工业应用中,RAG 需要利用专业领域的私有知识和逻辑,但现有方法在应用于专业领域时表现不佳,尤其是在 LLMs 不擅长的领域。PIKE-RAG 通过知识原子化任务动态分解,增强了对领域特定知识的提取和组织能力。此外,该系统能够自动从系统交互日志中提取领域知识,通过 LLMs 微调将学习到的知识固化下来,以更好地应用于未来的问答任务中。


01

PIKE-RAG 框架

如下图所示,PIKE-RAG是一个多功能且可扩展的 RAG 框架。该框架主要由多个基本模块组成,包括:文件解析、知识提取、知识存储、知识检索、知识组织、以知识为中心的推理,以及任务分解与协调。通过这种模块化的架构设计,PIKE-RAG 能够根据不同的系统能力需求,通过调整主模块内的子模块,灵活搭建不同的 RAG 方法,从而应对实际场景中的复杂需求。

02

L0 到 L4级分阶段系统构建策略

PIKE-RAG 采用了层次化、分阶段的系统构建与实现策略,确保系统能逐步提升对复杂问题的处理能力。如下图所示:

把系统构建分为 L0 到 L4(即知识库构建(L0)、事实型问题模块(L1)、链式推理问题模块(L2)、预测型问题模块(L3)、创造型问题模块(L4)),每个阶段都有不同的目标和挑战。

目前,该系统不论是在公开的基准测试中,还是在一些专业领域都取得了较好成绩。关于PIKE-RAG的更多信息请参考如下开源项目与论文:


GitHub 链接:https://github.com/microsoft/PIKE-RAG论文链接:https://arxiv.org/abs/2501.11551(opens in new tab)


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询