我要投稿

使用Kernel Memory进行RAG评估：AI助力企业知识管理新突破

发布日期：2024-06-27 19:51:24 浏览次数： 2519

作者：许泽宇的技术分享

微信搜一搜，关注“许泽宇的技术分享”

在现代企业知识管理中，随着业务的不断发展和扩展，各种文档和数据呈现爆炸式增长。为了有效且高效地管理这些知识，企业通常会导入大量文档。然而，当涉及到对文档切片质量和回答准确度的判断时，传统的人工方法显得既费时又费力。既然我们已经在使用AI技术，那么能否让AI来接管这部分工作？答案是肯定的，这正是RAG评估的用武之地。

https://github.com/explodinggradients/ragas?tab=readme-ov-file

今天，我们将深入探讨一个名为Kernel Memory中的一个实验性项目，它还未正式发布，但已经在AI社区中引起了广泛关注。Kernel Memory中的Evaluation模块包含两部分：TestSetGenerator和TestSetEvaluator，分别用于生成测试数据集和基于数据集进行质量评估。使用这些工具，我们可以显著降低人工成本，提高文档处理的效率和准确性。

TestSetGenerator：生成测试数据集

在进行Kernel Memory评估之前，首先需要创建一个测试集，这个测试集包含查询和预期的答案。虽然这是一个手工过程，但对于大数据集来说，可能非常繁琐。为了简化这个过程，我们提供了一个生成器，它可以从给定的Kernel Memory内存和索引中创建测试集。

以下是一个简单的示例代码：

using Microsoft.KernelMemory.Evaluation;
var testSetGenerator = new TestSetGeneratorBuilder(memoryBuilder.Services).AddEvaluatorKernel(kernel).Build();
var distribution = new Distribution{Simple = .5f,Reasoning = .16f,MultiContext = .17f,Conditioning = .17f};
var testSet = testSetGenerator.GenerateTestSetsAsync(index: "default", count: 10, retryCount: 3, distribution: distribution);
await foreach (var test in testSet){Console.WriteLine(test.Question);}

在这个示例中，我们首先使用TestSetGeneratorBuilder来创建一个测试集生成器，并添加Evaluator内核。接下来，我们定义了一组分布参数，用于确定不同类型问题的比例。最后，我们生成测试集，并打印每个测试的问题。

TestSetEvaluator：质量评估

一旦我们生成了测试集，下一步就是进行评估。通过TestSetEvaluator，我们可以评估Kernel Memory的性能。以下是相关代码示例：

var evaluation = new TestSetEvaluatorBuilder().AddEvaluatorKernel(kernel).WithMemory(memoryBuilder.Build()).Build();
var results = evaluation.EvaluateTestSetAsync(index: "default", await testSet.ToArrayAsync());
await foreach (var result in results){Console.WriteLine($"Faithfulness: {result.Metrics.Faithfulness}, ContextRecall: {result.Metrics.ContextRecall}");}

在这个示例中，我们首先创建一个TestSetEvaluator，并添加Evaluator内核和内存配置。接下来，我们评估测试集，并打印每次评估的结果，包含信实度（Faithfulness）和上下文回溯（ContextRecall）两个关键指标。

项目结构

在Evaluation项目中，我们可以看到代码量并不大主要是提示词这里需要注意的是，Kernel Memory的提示词为英文，这里对中文的效果可能会打折扣，于是乎我把它平移翻译为中文来进行测试

例如这就是一个翻译前后的对比，由于这里大量依赖json输出，所以使用的模型必须支持json_object 否则在跑起来会有比较多的报错。

实际应用案例：AntSK项目

在我们的AntSK项目中，我们已经集成了Evaluation模块进行质量评估。详情请参考我们的GitHub项目页面（AntSK）。

https://github.com/AIDotNet/AntSK

通过结合Kernel Memory的Evaluation模块和AntSK项目，我们不仅可以实现高效的文档管理和评估，还能为企业带来更多的创新和提升整体效率。

总结与展望

使用Kernel Memory进行RAG评估是一个创新和高效的解决方案，能够显著降低企业在知识管理方面的人工成本，同时提高处理效率和准确性。随着AI技术的不断发展和成熟，未来我们可以期待更多类似的工具和方法被开发和应用，为企业的智能化转型提供更强大的支持。

如果您在企业知识管理方面遇到挑战或希望探索更多AI技术的应用，不妨试试Kernel Memory和AntSK项目，相信它们会为您的工作带来意想不到的惊喜。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-03

爆改RAG检索体验：向量+关键词，双剑合璧的“融合检索”实战指南

2025-07-02

企业级RAG智能体落地实战：10个血泪教训让你避开99%的坑

2025-07-02

【Ragflow】30.离线环境迁移方案

2025-07-02

如果你的RAG系统不好用，请收藏一下这份RAG系统优化指南

2025-07-02

从零搭建企业级RAG知识库问答系统

2025-07-01

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地化大模型接入RagFlow错误记录

2025-04-13

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

RAGFlow如何实现图片问答：原理分析+详细步骤（附源码）

2025-04-09

MCP与RAG，and 让我们用MCP的Tool莽穿一切！

2025-04-16

深度解读：LlamaIndex 实现 RAG 重排序的关键要点

2025-05-08

老码小张实测：GitMCP 太神了！一行 URL 让 AI 秒懂你的 GitHub 项目

2025-04-05

RAG进阶：Embedding Models嵌入式模型原理和选择

2025-04-23

MCP + 数据库，一种比 RAG 检索效果更好的新方式！

2025-04-08

构建Agentic RAG 系统的方法有哪些？

2025-04-09

旺精通~智能体检索增强生成(Agentic RAG)综述：背景、模型、框架、测试、展望

2025-04-10

大家都在问

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-07-01

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

你的RAG系统安全么？

2025-06-29

RAGFlow实战：如何根据文档类型选择最佳切片策略？

2025-06-20

为什么说『RAG开箱即用』是最大的AI技术谎言？

2025-06-19

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部