微信扫码
与创始人交个朋友
没有采用现成的 RAG 中间件(比如LangChain和LlamaIndex)
能够自动识别文档的布局,包括标题、段落、图表等。比如我输入“Figure 1”进行测试,能召回对应的图,但还是只能保留了图的文本信息,但是对话时无法进行多模态理解
对表格进行单独处理和存储,且较好的还原了HTML表格,准确率还可以。在代码中,每个chunk使用的react-pdf-highlighter组件进行高亮显示,体验不错
为了适应不同行业和岗位对文档的不同需求,例如会计、HR、科研工作者等会接触到不同类型的文档,RAGFlow 提供了以下丰富的分块解析方法以及实例:
能够让用户随时查看是基于哪些原文生成答案的,提供了原文的引用链接,并允许用户进行详细的查看和对照。
追求对非结构化数据的深度语义理解,并计划将更加可扩展的文档结构识别模型应用到系统中,以适应企业级复杂场景的需求。
在数据源接入与集成方面,RAGFlow 设计目标是能够处理更多复杂场景,尤其是B端场景,并计划接入企业的各类数据源,如 MySQL 的 binlog、数据湖的 ETL、外部爬虫等,以实现更广泛的应用。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-16
RAG深度优化:全面掌握多种ReRanker实现方法与技巧
2024-09-16
Perplexity AI使用感受
2024-09-16
大模型应用框架解析:RAG、Agent、微调、提示词工程究竟是什么?
2024-09-15
RAG预处理增强:让Fastgpt/Dify召回更多东西
2024-09-15
数据隐私与RAG:如何在保护隐私的同时与数据库对话(Text2SQL)。
2024-09-15
【RAG】FastEmbed:一种轻量的快速文本嵌入工具
2024-09-15
RAG优化神器:rerankers重新排名模型的终极方案,提供轻量级统一API
2024-09-14
graphRAG后的triplex、itext2KG与nano-graphRAG对比介绍
2024-07-18
2024-07-08
2024-07-09
2024-06-20
2024-05-05
2024-07-09
2024-06-13
2024-07-07
2024-07-14
2024-07-07
2024-09-16
2024-09-12
2024-09-11
2024-09-10
2024-09-09
2024-09-07
2024-09-04
2024-08-30