AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


被一个pdf整破防了?大可不必!
发布日期:2024-06-21 13:47:24 浏览次数: 2446 来源:腾讯


最近,我们的腾讯云大模型知识引擎新鲜出炉。

最快只要5分钟,就能用它轻松搭建自己的知识服务小助手。

作为一个知识引擎,首先就得看懂「知识」——特别是让打工人和学生党破大防的PDF!

面对有字有图还有表、一复制格式就乱的PDF,还有行业报告、会议PPT、课本、说明书、合同单据、学术论文......等海量复杂材料,AI有阅读困难吗?

对传统OCR技术来说,复杂版面确实是个问题,有时候一些错误可能令人哭笑不得。

比如把车灯识别成字母——

或者直接把识别不出来的东西都给你丢了!我那么大的图呢???

但腾讯云大模型知识引擎,有一项新能力——大模型知识引擎文档解析

基于腾讯优图实验室自研新一代多模态文档解析大模型,它能先通过版面分析定位文档所有内容的位置和类型,再对文本表格公式等内容进行精准识别,最后按照我们人类的阅读顺序输出连贯可读的内容。

对它而言,只要扫一眼,就能看出一页文档里巨大的信息量——

而最后输出的结果,也智能到令人感动。

比如,面对带表的文档,特别表格没有框的,它能通过融合行列关系特征和元素特征来预测表格的行列间隔线——

说人话就是算法能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!

再比如,这种常见的“跨栏式”排版+格式诡异的公式,能难倒我,但好像难不倒它。不仅能识别特殊格式,语序都给你顺好喽!

顺便一说,不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体

更惊喜的是,它还支持将识别后的图片、PDF文档转换为Markdown格式输出,能为大模型训练添砖加瓦!

大概是长这个样子:

毕竟,图文混排版式复杂的文档,很容易由于识别时错位而被错误解析,课本都是错的,大模型学起来准确率岂不是大受影响?

而大模型知识引擎文档解析目前对复杂文档的解析准确率可达98%以上。

再将解析后的内容转换为Markdown这种易读易写的轻量级标记语言,减少错误率,也为大模型训练提供了丰富的结构化数据源帮助提高模型的泛化能力和适应性。

目前,这项文档解析功能已在多个产品上线,我们还打包了标准化的API服务,开箱即用!

在线体验大模型知识引擎文档解析功能

感兴趣的企业用户,也可以戳这里,我们将帮助你更好地使用和集成这项功能:

企业用户需求快速通道

工欲善其事,必先利其器。而让人们少些时间烦恼,多些时间创造,可能才是这些AI工具的意义。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询