微信扫码
添加专属顾问
我要投稿
RAGFlow新版本提升效率,告别通宵等待知识图谱生成结果。 核心内容: 1. RAGFlow最新版本大幅提升知识图谱生成效率 2. 官方详细更新日志解读,包括新功能和问题修复 3. Deep Research功能重点介绍,实现深度研究和知识推理
开篇之前做一些说明。
最近技术咨询实在太多,真心感谢大伙儿的信任!但说实话,我现在有点扛不住了。很多兄弟连win的使用一些问题都@我,其实用深度求索(deepseek)、Kimi这些工具分分钟就能解决,比我手动回复快多了——不信你们试试,这俩工具处理技术文档比人靠谱。
当初想着能帮就帮,结果现在业余时间全被咨询占满,连内容更新都耽误了。可能你们觉得问个问题就几分钟,但我每天面对的是n个。所以以后不回消息不是看不起你们,实在是精力有限。我需要更多的时间去学习,去实践来保持稳定的更新。
最近ragflow和dify都在疯狂的更新,每家产品更新后都带出来一堆bug。dify的1.0.0一堆bug,到1.0.1解决了一部分。ragflow也是一样。最近也是疯狂的更新。我们看下官方的更新日志。
在v0.17.0中,比较重要的更新的点。
Deep Research
,官方发文,重点介绍这个在v0.17.1中的重点
导致无法添加ollama和Xinference部署的模型的bug
在v0.17.2中
我比较看中的知识图谱的升级。具体升级以后速度提升多少,我等下实验告诉你们。
在ragflow的官方中,关于知识图谱,主要有两个文档,
https://ragflow.io/blog/ragflow-support-graphrag
主要内容
infinity
多跳问答
和跨文档查询
https://ragflow.io/docs/dev/construct_knowledge_graph
主要内容:
infinity
想深读了解的,可以看看
https://github.com/microsoft/graphrag
https://arxiv.org/abs/2402.19472
看官方的解释:知识图谱对于涉及嵌套逻辑的多跳问答特别有用。在对包含复杂实体和关系的书籍或作品进行问答时,它们的表现优于传统的提取方法。
知识图谱中的实体类型是对现实世界或抽象概念中各类对象的分类和抽象,是构建结构化知识的基础。我们看下ragflow提供的几类实体,我们也可以添加其他的。最后由大模型去整理。
ragflow提供两种方法可以选择。
一般我们使用Light即可。
实体归一化是将文本中提及的 不同形式、别名或歧义实体 映射到知识库中 唯一标准实体 的过程。其核心目标是消除表述差异,确保同一实体在不同数据源或上下文中被统一标识。
ragflow在解析过程会将具有相同含义的实体合并在一起,从而使知识图谱更简洁、更准确。应合并以下实体:特朗普总统、唐纳德·特朗普、唐纳德·J·特朗普、唐纳德·约翰·特朗普。
有以下几种技术实现
同义词归并 | 马云(实体ID: E123) | |
歧义消解 | ||
跨语言对齐 | 纽约市(Q60) | |
动态更新 | GPT-4(Q1209) |
由于知识图谱的构建需要LLM,不需要太强的推理能力,我使用了qwen-plus在线模型。
采用统一切片方法。
每次操作流程
docker compose down
esdata01
文件夹docker compose up -d
构建出来的知识图谱
resolution
花费了4800秒我们可以看到只是前面的解析+关键词构建,花费时间很短的,大头都在知识图谱的构建。
我们看下耗时对比。
我让deepseek整理下使用知识图谱的条件
if 文档满足以下任意条件:
1. 含超过50个实体互连
2. 需处理NLP时间表达式(如"三个月前"→2024-03-01)
3. 查询含2层以上逻辑嵌套
4. 涉及跨表/跨文档关系验证
then 启用知识图谱
else 使用传统检索
ragflow文件上传限制解决。我不知道什么时候把文件上传限制到了10mb,修改限制也很简单。
nginx.conf
文件client_max_body_size
限制。docker compose down
docker compose up -d
deepseek相关资料,包含内容如下https://pan.quark.cn/s/faa9d30fc2bd
https://pan.baidu.com/s/10vnv9jJJCG-KKY8f_e-wLw?pwd=jxxv
ollama+deepseek本地部署
局域网或断网环境下安装DeepSeek
vlllm部署deepseek基准测试
不要浪费deepseek的算力了,DeepSeek提示词库指南
服务器繁忙,电脑配置太低,别急deepseek满血版来了
DeepSeek+本地知识库:真的太香了(修订版)
DeepSeek+本地知识库:真是太香了(企业方案)
deepseek一键生成小红书爆款内容,排版下载全自动!睡后收入不是梦
最轻量级的deepseek应用,支持联网和知识库
当我把公众号作为知识库塞进了智能体后
个人神级知识库DeepSeek+ima 个人学习神器
DeepSeek+dify 本地知识库:真的太香了
Deepseek+Dify本地知识库相关问题汇总
dify的sandbox机制,安全隔离限制
DeepSeek+dify 本地知识库:高级应用Agent+工作流
DeepSeek+dify知识库,查询数据库的两种方式(api+直连)
DeepSeek+dify 工作流应用,自然语言查询数据库信息并展示
聊聊dify权限验证的三种方案及实现
dify1.0.0版本升级及新功能预览
DeepSeek+ragflow构建企业知识库:突然觉的dify不香了(1)
DeepSeek+ragflow构建企业知识库之工作流,突然觉的dify又香了
DeepSeek+ragflow构建企业知识库:高级应用篇,越折腾越觉得ragflow好玩
模型微调之基础篇:模型微调概念以及微调框架
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-17
35.2K star!双链笔记+知识图谱+本地优先,这款开源知识管理神器绝了!
2025-03-16
认识向量数据库
2025-03-13
一种在本地使用开源大模型将文档转换为知识图谱的方法
2025-03-05
低成本+高性能+超灵活!Deepseek 671B+Milvus重新定义知识库搭建
2025-03-05
LlamaIndex+Phi-3:知识图谱生成的黄金组合
2025-03-04
一键发布知识图谱:Obsidian 与 Quartz 的高效协作
2025-03-04
构建智能知识库 - 知识获取:Obsidian Web Clipper 的 AI 自动化流程
2025-03-02
大模型时代的知识工程:企业级智能知识库构建与增强指南
2025-01-02
2024-07-17
2024-08-13
2025-01-03
2024-07-11
2024-06-24
2024-08-27
2024-07-13
2024-06-10
2024-07-12
2025-02-13
2025-01-14
2025-01-10
2025-01-06
2025-01-02
2024-12-16
2024-12-10
2024-12-04