RAGFlow（2）：集成深度文档理解能力的RAG引擎

发布日期：2024-05-02 11:25:20 浏览次数： 4549

作者：人工智障与神经病网络研究所

微信搜一搜，关注“人工智障与神经病网络研究所”

RAG常见的应用架构如下，整个架构图的核心主要是两部分：

向量数据库：文档向量存储与查询召回
中间件：文档分块处理并转成合适的Embedding，比如LangChain和LlamaIndex

RAG现存问题与解决方法

问题1：向量表征的语义召回粒度难以控制

通过对文档进行适当的切分，可以平衡语义的精确度和召回的效率。使用LangChain、LlamaIndex等中间件来实现文档的合理切分。

问题2：文档切分策略的确定

采取基于空白的文字分段，并将标题与段落合并的策略，以确保段落既能够体现局部文字的语义，也能反映整篇文章或章节的主题。

问题3：RAG系统与LLM微调的争论

随着时间的推移，业界逐渐认识到RAG系统和LLM微调各有优势，两者可以结合使用，以达到更好的问答质量。RAG系统在实时性和成本方面相较于LLM微调具有优势，因此更受青睐。

问题6：长上下文LLM对RAG的挑战

尽管长上下文LLM在处理长文本和复杂图表方面表现出色，并不能满足用户海量数据的需求，成本高，速度也不够快，也只能针对长文本、图片等数据提问。RAG依然在个人知识库问答场景依然是非常必要的，两者可以结合使用。LLM 的长上下文能力，对于 RAG 来说应该是很大的促进。用 OpenAI 联创 Andrej Karpathy 的一张图做个类比，他把 LLM 比喻为一台计算机的 CPU，把上下文类比为计算机的内存，那么以向量为代表的数据库，就可以看作是这台计算机的硬盘

问题7：RAG的查询和排序能力

比如单纯依靠向量数据库进行单路召回很难满足 RAG 落地要求。目前 RAG 大多面向C端个人知识库这样的简单场景，这些场景的用户数据，基本都是文档，那么个人用户对于文档的提问，大体上都是围绕着摘要总结来做的，答案看上去差不多就行。当面向B端时，单靠向量检索就力不从心了，一来无法对精确信息召回，二来无法与企业内部信息系统集成（大量结构化数据）。所以必须在检索阶段引入多路召回和重排序，保证数据查询的准确度。

问题8：如何应对复杂多变的数据

这些数据包含各种格式，更复杂的还包含各类图表等，如果在没有理解这些语义的基础之上直接提供 RAG 方案，例如简单的根据文字空白就来切分段落，就会导致语义丢失从而让最终查询的结果也是混乱不堪。infiniFlow提出的 Infinity AI原生数据库。它旨在应对RAG在企业级应用中所面临的复杂查询挑战：这包括如何将企业现有的各类数据——不仅涵盖非结构化的内容如文档和图片，也包括结构化的信息系统——进行有效整合，并在此基础上实现多路召回机制和最终的融合排序解决方案。

? 部署体验

ragflow本地容器化部署

先拉一下代码

git clone https://github.com/infiniflow/ragflow.git

ragflow默认从hf上下载模型，如果没有梯子，就配置一下ragflow/docker/docker-compose.yml文件里面的hf的endpoint地址，改成 https://hf-mirror.com接着按照下面步骤启动容器即可

cd ragflow/docker/

chmod +x ./entrypoint.sh

sudo sysctl -w vm.max_map_count=262144

sudo docker compose up -d

服务启动后，查看一下日志

sudo docker logs -f ragflow-server

看到这个就ok了打开 http://localhost:80 即跳转登录页面，注册之后就可以进入

通过ngrok配置转发ragflow服务

ngrok在ubuntu的快速安装

sudo apt install snapd  # 先安装snap
snap install ngrok

安装完之后需要在官网注册一下，并且配置token

ngrok config add-authtoken 2d********Jpg

ngrok查看配置路径

ngrok config check

打开上面的配置路径，可以在authtoken字段下面增加tunnel字段。但是注意，官方只提供一个免费域名，也就是只能一个app配置这个域名，那其他app就会随机分配域名

tunnels:
  ssh:
    proto: tcp
    addr: 2222
  jupyter:
    proto: http
    addr: 8888
    domain: assured-fowl-gladly.ngrok-free.app
  ragflow:
    proto: http
    addr: 80

除了上面proto、addr、domain字段之外，还有下面配置要注意：ngrok管道只能起一次，比如要起多个jupyter和ragflow两个app，那么只能一次过启动

ngrok start jupyter ragflow

不能分开在不同的终端分别执行 ngrok start jupyter 和 ngrok start ragflow。但是如果你不想动配置管道，且在启动ragflow服务时，指定了域名，可以这样

ngrok http --domain=assured-fowl-gladly.ngrok-free.app 80

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-04

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-03

RAG 检索优化策略：从命中率到答案质量的一套工程打法

2026-07-03

RAG 落地总翻车？全球赛事冠军架构，改造适配企业级生产

2026-07-01

提升 RAG 准确率全攻略让你的 AI 知识库真正靠谱起来！

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

2026-06-30

本体论语义建设新思路，另类RAG来解决检索问题

2026-06-30

别把RAG当架构：Ontology（本体）才是Agent的业务世界

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

RAG已死？不，是Grep回归了！

2026-04-30

大家都在问

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-04

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw