微信扫码
与创始人交个朋友
我要投稿
最近,我们的腾讯云大模型知识引擎新鲜出炉。
最快只要5分钟,就能用它轻松搭建自己的知识服务小助手。
作为一个知识引擎,首先就得看懂「知识」——特别是让打工人和学生党破大防的PDF!
面对有字有图还有表、一复制格式就乱的PDF,还有行业报告、会议PPT、课本、说明书、合同单据、学术论文......等海量复杂材料,AI有阅读困难吗?
对传统OCR技术来说,复杂版面确实是个问题,有时候一些错误可能令人哭笑不得。
比如把车灯识别成字母——
或者直接把识别不出来的东西都给你丢了!我那么大的图呢???
但腾讯云大模型知识引擎,有一项新能力——大模型知识引擎文档解析!
基于腾讯优图实验室自研新一代多模态文档解析大模型,它能先通过版面分析定位文档所有内容的位置和类型,再对文本表格公式等内容进行精准识别,最后按照我们人类的阅读顺序输出连贯可读的内容。
对它而言,只要扫一眼,就能看出一页文档里巨大的信息量——
而最后输出的结果,也智能到令人感动。
比如,面对带表的文档,特别表格没有框的,它能通过融合行列关系特征和元素特征来预测表格的行列间隔线——
说人话就是算法能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!
再比如,这种常见的“跨栏式”排版+格式诡异的公式,能难倒我,但好像难不倒它。不仅能识别特殊格式,语序都给你顺好喽!
顺便一说,不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体。
更惊喜的是,它还支持将识别后的图片、PDF文档转换为Markdown格式输出,能为大模型训练添砖加瓦!
大概是长这个样子:
毕竟,图文混排版式复杂的文档,很容易由于识别时错位而被错误解析,课本都是错的,大模型学起来准确率岂不是大受影响?
而大模型知识引擎文档解析目前对复杂文档的解析准确率可达98%以上。
再将解析后的内容转换为Markdown这种易读易写的轻量级标记语言,减少错误率,也为大模型训练提供了丰富的结构化数据源,帮助提高模型的泛化能力和适应性。
目前,这项文档解析功能已在多个产品上线,我们还打包了标准化的API服务,开箱即用!
在线体验大模型知识引擎文档解析功能
感兴趣的企业用户,也可以戳这里,我们将帮助你更好地使用和集成这项功能:
企业用户需求快速通道
工欲善其事,必先利其器。而让人们少些时间烦恼,多些时间创造,可能才是这些AI工具的意义。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-13
2024-08-21
2024-07-09
2024-06-13
2024-08-04
2024-04-11
2024-07-18
2024-07-01