微信扫码
添加专属顾问
我要投稿
告别PDF解析烦恼,享受多模态知识管理新时代。 核心内容: 1. FastGPT 4.9.0 版本带来的知识库体验升级 2. PDF增强解析功能,解决传统知识库的痛点 3. 多模态知识管理,提升文档处理效率和准确性
• PDF文档结构复杂,解析后格式混乱
• 扫描件内容无法被正确识别
• 图表变形或消失
• 公式转换成乱码
重要的图表和示意图全都"蒸发",只剩下占位符
你期待的是数据分析,得到的却是一团乱码
精心编写的数学公式变成了一串无法辨认的符号
没有结构、没有层次,密密麻麻的文字堆在一起看得头疼,阅读五分钟就想闭眼
这哪是AI助手,分明是"折磨助手"...
说好的提升效率,怎么变成了增加烦恼?
作为国内领先的知识库产品,FastGPT决定彻底解决这些痛点!
告别传统知识库的单调文本体验,FastGPT 4.9带您进入多模态知识管理新时代!
还在为知识库中的PDF内容展示不全面而烦恼吗?FastGPT最新版带来革命性体验:
FastGPT现已在页面上集成PDF增强解析交互功能,并内嵌Doc2x专业文档处理服务,让您的PDF文件解析达到新高度!
扫描件精准识别 - 支持扫描版PDF识别,文字清晰可辨
文本结构化 - PDF可转换为结构化Markdown格式,保留原始排版和层次关系
?️ 图片保留 - 可以提取文档中的所有图片,并以链接形式报错
➗ LaTeX公式 - 数学公式、专业符号精准识别并转换,文档处理更专业
? 表格数据 - 复杂表格结构化呈现,数据关系一目了然
Step 1: 准备工作
打开您的知识库,在右侧根据需要选择合适的模型
Step 2: 导入文档
点击右上角的"新建/导入"按钮选择"文本数据集"上传您的文档
Step 3: 开启增强解析
上传完成后点击"下一步",您会看到全新的PDF增强解析选项
我们推荐同时开启自动生成补充索引和图片自动索引,效果更佳
Step 4: 预览与完成
点击左侧的文件进行预览
系统会显示分块预览内容
确认无误后,点击"下一步",再点击"开始上传"
耐心等待训练完成,状态变为"已就绪"
点击目标文件,立即体验增强解析的强大功能:
文本呈现清晰整洁
图片识别完整精准
LaTeX公式自动识别渲染
表格数据结构化展示,一整个爱上
PDF 扫描增强,丝滑转化
除了革命性的PDF增强解析,我们还带来了更多实用功能和性能提升!
FastGPT全新推出的图片自动标注功能,彻底改变了知识库处理视觉内容的方式,让图片都能够更好地被理解、被检索、被利用。
自动识别 PDF 中的图片内容并生成 Markdown 格式准确描述,并为图片创建可检索的标签
实际效果展示
来看一个真实案例,当我们在知识库中上传了 RAG 相关内容:
我们可以看到增加了对图片的索引部分
如果不打开这个功能,我们就只能自定义索引
为图片创建可检索的标签
这意味着您可以通过关键词直接搜索相关图片的内容
优化知识库内图片的搜索体验
无需人工干预,全程自动化处理
同时,我们还重新设计了知识库文件上传的数据逻辑和交互流程,让整个过程更加流畅高效。
通过升级 pg vector 插件至 0.8.0 版本,我们引入了迭代搜索技术:
扩大检索范围,减少死元组影响召回数量
新版本在保持检索精度的同时,将原本难以检索到的"边缘信息"纳入搜索范围,实现了更全面的知识覆盖。
除了闪亮的新功能,我们还对系统进行了全方位的优化与修复,让您的使用体验更加流畅!
重大突破:知识库索引数量不再受限!
可无限创建自定义索引,满足不同场景需求
系统会自动更新输入文本的索引
利用无限索引功能,您可以为同一知识点创建多种表述形式,大幅提高检索命中率!
我们优化了Markdown内容处理,特别是:
自动检测链接后的中文标点符号
Prompt模式工具调用现已支持思考模型,同时:
显著减少空输出概率
通过优化代码和数据库存储结构,我们实现了大幅的性能提升:
成果:50M PDF读取速度提升3倍!
增加了网页抓取的安全链接校验机制防止潜在风险
解决了批量运行时全局变量传递的问题:
修复了变量未能正确传递到下一次运行的bug
⚠️ 重要更新通知
为了提供更好的服务体验,我们进行了以下必要调整:
私有化部署的自定义文件解析方案已弃用
请尽快同步更新到最新的配置方案,享受更稳定的服务和新功能支持
旧版本地文件上传 API 已弃用:/api/core/dataset/collection/create/file
(原商业版专属API)已切换为:/api/core/dataset/collection/create/localFile
外部文件库相关 API 即将停用:建议尽快迁移至功能更完善的 API 文件库
上传文件至知识库、创建连接集合等接口的trainingType
字段调整:
未来仅支持chunk
和QA
两种模式
增强索引模式将使用独立字段:autoIndexes
目前仍兼容旧版trainingType=auto
,但请尽快更新您的代码
这些优化和修复也许不如新功能那样引人注目,但它们是提升整体用户体验的关键基石。我们致力于在每个细节上精益求精,让FastGPT成为您最可靠的AI助手!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-10
Manus工作原理揭秘:解构下一代AI Agent的多智能体架构
2025-03-05
如何构建多模态AI知识库?
2025-03-02
从模糊到清晰,Agentic设计原则重塑AI Agent未来
2025-03-02
我为什么要卸载DeepSeek ?
2025-02-28
一键部署!阶跃星辰开源多模态模型上线火山引擎
2025-02-22
DeepSeek热潮背后,企业如何用多模态数据构建核心竞争力
2025-02-22
MNN 手机本地部署 DeepSeek R1 和多模态大模型,告别服务器繁忙!
2025-02-21
多模态RAG技术:从语义抽取到VLM应用与规模化挑战
2024-09-12
2024-06-14
2024-08-06
2024-05-30
2024-06-17
2024-08-30
2024-11-28
2024-04-21
2024-10-16
2024-10-07