AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


使用 Azure 文档智能的 markdown 输出功能和 Azure OpenAI 服务分析复杂文档
发布日期:2024-05-08 04:55:31 浏览次数: 1755


在当今数字化时代,数据已成为企业的重要资产,从复杂文档中高效提取和处理信息对企业至关重要,这些文档包括那些含有动态表格的文件。微软的 Azure AI 服务为应对这些挑战提供了强大的解决方案,尤其是通过文档智能 Layout 模型,可精准满足企业需求。在这篇文章中,我们将探讨如何使用 markdown 输出来增强 Azure 文档智能 Layout 模型的功能,并将这些精细化的数据输入到 Azure OpenAI 服务中,从而实现全面的信息提取。




Azure 文档智能 Layout 模型是 Azure AI 生态系统中的一个强大工具,旨在理解和解析文档的布局和结构。它可以分析文本、表格和选择标记等各种元素,是处理复杂文档的得力助手。

尤其是提取表格,它是处理包含大量数据的文档的关键,这些文档通常以表格形式呈现。Layout 模型提取 JSON 输出的 pageResults 中的表,包括表的列数和行数、行高和列高。 系统会输出带有边界多边形的单元格,同时指明该区域是否为 columnHeader(列标题)。 该模型支持提取旋转的表格。 每个表单元格都包含行和列索引以及边界多边形坐标。对于单元格文本,模型输出包含起始索引 offset (偏移量) span (跨度)信息。 该模型还输出全文的首级文本要素的  length(长度) 。

{    "tables": [        {            "rowCount": 9,            "columnCount": 4,            "cells": [                {                    "kind": "columnHeader",                    "rowIndex": 0,                    "columnIndex": 0,                    "columnSpan": 4,                    "content": "(In millions, except earnings per share)",                    "boundingRegions": [],                    "spans": []                    },            ]        }    ]}


然而,如果需要将这些数据输入到 Azure OpenAI  服务中进一步利用,当前这种格式会很困难,因为对于复杂的大型表格来说,在提示符中这种格式可能会非常冗长。另一方面,如果我们使用纯文本输出,则表格结构会丢失。




Markdown 是一种轻量级的标记语言,具有纯文本格式化语法,可以作为中介格式来弥合原始文档数据和结构化数据分析之间的差距。通过将文档布局转换为 markdown,我们可以简化构建文档信息的过程,然后再将其输入到人工智能模型进行提取。


 提取信息的步骤为: 



1. 准备文件: 首先收集要分析的文档,这些文档可以是 PDF、Word 文档或图像等各种格式。

2. 使用 Azure 文档智能 Layout 模型分析文档: 利用 Azure 文档智能 Layout 模型分析文档结构。该模型将识别并分类文档中的不同元素,如段落、表格和标题。

3. 转换为 markdown: Layout API 可以将提取的文本输出为 markdown 格式。使用 outputContentFormat=markdown 来指定 markdown 输出格式。Markdown 内容将作为 content (内容)的一部分输出。

"analyzeResult": {"apiVersion": "2024-02-29-preview","modelId": "prebuilt-layout","contentFormat": "markdown","content": "# CONTOSO LTD...",}

我们可以在文档智能 Studio 中进行同样的操作。


? 文档智能Studio -> Layout模型 -> 分析选项

在 文档智能 Studio 中选择 markdown 作为输出



4. 使用 Azure AI 提取信息:现在,文档信息已经以 markdown 结构化的形式呈现,您可以利用各种 Azure AI 服务来提取特定信息。当与 Azure OpenAI 服务一起使用时效果显著,因为当您在提示中指示模型读取 markdown 表格时,可以轻松准确地查询表格中的信息。

摘自文档的表格

提取表格的 markdown 表示形式

在 Azure OpenAI Studio 中查询 markdown 文本



5. 提取后处理: 提取后,可根据业务需求进一步处理或分析数据。这可能涉及从多个文档中汇总数据、执行数据可视化或将提取的信息集成到业务工作流中。





使用 markdown 作为中介格式具有几个优点:

? 简化数据结构:markdown 简化了文档的布局,使得AI模型更容易处理信息。

? 灵活性:markdown 应用广泛,可以轻松转换为其他格式或在不同平台上显示。

? 效率:这种方法可以处理动态表格和不同布局的文档,减少手动预处理工作。




带有 markdown 输出的  Azure 文档智能 Layout 模型提供了一种灵活的方法,用于处理和提取复杂文档中的信息。Azure AI 可帮助企业发掘隐藏在文档中的有价值的见解,提高决策和运营效率。这一流程不仅简化了数据提取,还为自动化和优化文档密集型工作流程开辟了新途径。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询