微信扫码
与创始人交个朋友
我要投稿
在当今数字化时代,数据已成为企业的重要资产,从复杂文档中高效提取和处理信息对企业至关重要,这些文档包括那些含有动态表格的文件。微软的 Azure AI 服务为应对这些挑战提供了强大的解决方案,尤其是通过文档智能 Layout 模型,可精准满足企业需求。在这篇文章中,我们将探讨如何使用 markdown 输出来增强 Azure 文档智能 Layout 模型的功能,并将这些精细化的数据输入到 Azure OpenAI 服务中,从而实现全面的信息提取。
Azure 文档智能 Layout 模型是 Azure AI 生态系统中的一个强大工具,旨在理解和解析文档的布局和结构。它可以分析文本、表格和选择标记等各种元素,是处理复杂文档的得力助手。
尤其是提取表格,它是处理包含大量数据的文档的关键,这些文档通常以表格形式呈现。Layout 模型提取 JSON 输出的 pageResults 中的表,包括表的列数和行数、行高和列高。 系统会输出带有边界多边形的单元格,同时指明该区域是否为 columnHeader(列标题)。 该模型支持提取旋转的表格。 每个表单元格都包含行和列索引以及边界多边形坐标。对于单元格文本,模型输出包含起始索引 offset (偏移量)的 span (跨度)信息。 该模型还输出全文的首级文本要素的 length(长度) 。
{ "tables": [ { "rowCount": 9, "columnCount": 4, "cells": [ { "kind": "columnHeader", "rowIndex": 0, "columnIndex": 0, "columnSpan": 4, "content": "(In millions, except earnings per share)", "boundingRegions": [], "spans": [] }, ] } ]}
然而,如果需要将这些数据输入到 Azure OpenAI 服务中进一步利用,当前这种格式会很困难,因为对于复杂的大型表格来说,在提示符中这种格式可能会非常冗长。另一方面,如果我们使用纯文本输出,则表格结构会丢失。
Markdown 是一种轻量级的标记语言,具有纯文本格式化语法,可以作为中介格式来弥合原始文档数据和结构化数据分析之间的差距。通过将文档布局转换为 markdown,我们可以简化构建文档信息的过程,然后再将其输入到人工智能模型进行提取。
使用 markdown 作为中介格式具有几个优点:
? 简化数据结构:markdown 简化了文档的布局,使得AI模型更容易处理信息。
? 灵活性:markdown 应用广泛,可以轻松转换为其他格式或在不同平台上显示。
? 效率:这种方法可以处理动态表格和不同布局的文档,减少手动预处理工作。
带有 markdown 输出的 Azure 文档智能 Layout 模型提供了一种灵活的方法,用于处理和提取复杂文档中的信息。Azure AI 可帮助企业发掘隐藏在文档中的有价值的见解,提高决策和运营效率。这一流程不仅简化了数据提取,还为自动化和优化文档密集型工作流程开辟了新途径。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19