AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


RAG之对于非结构性数据提取

发布日期:2025-03-12 07:50:03 浏览次数: 1553 来源:半路IT南
推荐语

深入解析非结构化数据提取技术,探索表格数据转文本的高效方法。

核心内容:
1. 非结构化数据提取的现实挑战与需求
2. 多模态技术在非结构化数据处理中的应用
3. RAG技术对垂直领域回答能力的提升

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
      前段时间在B站上看到一个up主分享了一个如何《将图片或PDF中复杂的表格数据转成纯文本输入大模型,如何保持表格文字的排版布局不变?》,后面在评论中和up主讨论了一下,当一个文档中出现了多种数据结构形式,比如文本、图片、表格、公式,而不是视频分享中的单一模式,对于这些形式内容的提取可以采用哪些方法呢?
https://www.bilibili.com/video/BV1hJvQeyEZS/?vd_source=a686566edc80a9ac643686804824933c#reply249547265968
其实这种非结构性数据文本在生活中似乎更长见,大家对这种数据的处理也确实比较头疼,后台也有很多好友咨询我处理的方式,这里对我自己的做法进行如下分享:
       整体思路可以参考omniparser,首先读取整个文本切分成单叶,然后对于每一页数据结合yolov8等模型对该页文本进行检测切分,整体结构如下,
而对于文章中经常出现的文本、图片、表格、公式等非结构性数据形式,通过检测模型得到对应的模块,然后分别送入对应的sota识别模块,这里可以结合传统的技术,也可以采用多模态技术,比如对于表格内容识别就可以利用Table-LLaVA等。然后再将提取的信息embedding到数据库,结合rag技术实现对基座llm在垂直领域的回答能力。
     最后,对于非结构性数据信息的提取,各种新的方式方法有很多,大家在学习中不断总结吧!


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询