AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenSPG/KAG v0.6 发布,兼顾事实推理与摘要生成,支持用户自定义 Schema
发布日期:2025-01-07 21:21:09 浏览次数: 1568 来源:SPG知识图谱



2025 年 1 月 7 日,OpenSPG/KAG 正式发布 v0.6 版本,此次发布带来多个功能更新,包括摘要生成类任务支持、垂域 Schema 管理、可视化知识探查等;用户体验上,提供知识库任务的断点续跑机制,新增用户登录与权限体系、优化构建任务调度;开发者模式下支持不同阶段配置不同模型、支持 schema-constraint 模式抽取等,极大地提升了系统的灵活性、易用性、性能和安全性,为用户提供一个更加强大,且适应多样化应用场景的知识管理平台。




新增功能





1

摘要生成类任务支持

不牺牲多跳事实推理精度的情况下,原生支持摘要生成任务。

在 CSQA 数据集上,全面性、多样性、赋权性等指标弱于 LightRAG (-1.2/10),事实性指标优于 LightRAG(+0.1/10);在 hotpotqa, twowiki, musique 等多跳问答数据集上,鉴于 LightRAG、GraphRAG 均未提供事实问答的测评入口,使用默认入口测试 EM 指标接近 0。
KAG 量化评测结果,可参考 KAG 代码仓库 examples/csqa/READEME.md 按步骤复现。

2

领域 Schema 管理

产品侧提供 SPG Schema 管理能力,支持用户根据通过自定义 Schema 以优化知识库构建&推理问答的效果。

3

知识探查

新增知识探查功能,实现知识库数据的可视化查询分析,并提供HttpAPI 与其它系统对接。

4

知识库构建支持挂载领域知识(开发者模式)

开发者模式下,支持将领域知识(领域词汇、词条间关系)注入知识库中,可显著提升知识库构建、推理问答效果(医疗场景下有10%+ 的提升)。

5

构建链路增加知识对齐组件

KAG-Builder 提供默认的知识对齐组件,并内嵌无效数据过滤、相似实体链指等功能,以优化图谱的结构和数据质量。




用户体验优化





1

断点续跑

产品模式、开发者模式下,分别提供文件级别、Chunk 级别的知识库构建任务的断点续跑能力,以降低任务失败后全量重跑所带来的时间和tokens 消耗。

2

用户登录&权限体系

提供用户登录&权限体系,防止未经授权的知识库数据访问和操作。

3

知识库构建任务调度优化

提供基于数据库的知识库构建任务调度能力,避免容器重启后任务异常或者中断。

4

支持不同阶段配置不同模型(开发者模式)

提供基于注册器的组件管理机制,允许用户通过配置文件实例化组件对象,支持用户开发&嵌入自定义组件到KAG-Builder、KAG-Solver 工作流 中,同时在工作流的不同阶段配置不同规模的大模型,以提升整体的推理问答性能。

5

Markdown、PDF、Word 文件版面分析优化

Markdown、pdf、word 等文件优先根据文件章节划分Chunk,以实现同一chunk 的内容更内聚。

6

项目全局配置及知识库配置

提供知识库全局配置功能,统一设置存储引擎、生成模型、表示模型的访问信息。

7

支持 Schema-constraint 模式的抽取链接(开发者模式)

提供 Schema-constraint 模式,知识库构建阶段,严格按照 Schema 的定义进行操作,从而实现更细粒度和更复杂的知识抽取。




未来规划




1. 更多的效果量化榜单发布(包括医疗、事理图谱、金融研报等场景的知识推理);

2. 复杂推理能力,子问题级领域知识精准注入,持续提升检索、推理的覆盖率和准确率;

3. 产品体验持续提升。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询