微信扫码
与创始人交个朋友
我要投稿
业务的运营需要文档和通信,它们是几乎所有流程的基础——无论在哪里都需要读取或发送消息(如电子邮件或聊天)或文档。因此,智能文档处理(IDP)市场每年增长 28.9%,预计 2032 年将达到178亿美元。
IDP 通常结合多种 AI 技术,包括自然语言处理(NLP)和图像识别,帮助企业快速、大规模处理文档和通信。业务领导者正在思考如何利用最新的 AI 工具为组织带来真正的价值,而 IDP 是一个很好的起点,因为它能够快速产生回报并大大提高效率。UiPath 委托 Forrester 进行的分析显示,技术决策者认为文档自动化的用例,如知识管理支持(48%)、数据提取和分配(43%),以及基于文档的问答(40%)都具有“变革性的价值”。
接下来有一个问题:是自建还是购买?评估所有选项并考虑哪种 IDP 方法能够带来最高的投资回报、最佳性能和最快的价值实现时间,这一点非常重要。对于大多数企业来说,购买现有的 IDP 解决方案是一个正确的选择。让我们来看看原因:
自建 IDP(BYO IDP)
随着公开可用的大型语言模型(LLM)兴起、各类支持 API 日益普及,自建 IDP 的可用工具变得前所未有的多。然而,拥有许多工具并不意味着实际工作会变得更轻松。
在自建 IDP 系统中,每个组件(从语言理解到数据提取和自动化)都需要从头开始构建,或者更有可能从多个第三方提供商那里获取。例如,为了提供必要的 NLP 组件来理解文档和通信,企业可能会围绕云提供商或超大规模公司的外部 GenAI 模型构建其 IDP 系统。
自建 IDP 系统为企业提供了端到端的所有权和更大的定制潜力,与供应商解决方案相比。他们可以灵活地适应其系统以满足不断变化的业务需求,而无需与其他组织合作。然而,在大多数情况下,这些优势被其面临的几大困难所抵消:
成本
人们普遍以为自建比支付 IDP 服务更便宜,然而无论从短期还是长期来看,在大多数情况下都并非如此。开发并维护自己的 IDP 系统需要大量时间和昂贵的专家人才。您需要软件开发人员创建平台和用户界面(UI),数据科学家进行数据准备、预处理和后处理,还有许多其他专家进行性能监控(您需要创建自己的报告仪表板)、审计和日志记录等任务。使用第三方 GenAI 模型也需要 AI 专家和工程师来微调所选模型以满足确切的业务需求。
维护自己的平台还需要不断更新版本资源。任何需要数据注释的自建 IDP 系统都需要为用户提供培训材料,并不时对这些材料进行更新来反映您用户界面的变化。
风险
系统依赖昂贵又稀缺的技术人才,这是有风险的。由于成本和人才短缺,这些团队往往规模较小。他们可能在支持实际用例和业务单位数量上会受到限制。长期来看,人才流失也可能导致系统变得低效或不可行,甚至面临项目资金被撤销的风险。
当需要 AI 技能和模型微调时,这些问题会加剧。在 Forrester 2023 年 9 月的 Artificial Intelligence Pulse Survey 中,30% 的 AI 决策者认为,缺乏技术技能是他们组织采用 GenAI 面临的最大障碍之一,这也是最常见的回答。
复杂性
在搭建 IDP 系统时,企业需要自己负责复杂的 AI 模型和平台治理。事实上,针对复杂用例构建的系统,可能需要数百个需要管理的 AI 模型。例如,一家大型银行可能需要数百个为各种用例微调的模型才能达到必要的精准水平。即使 AI 系统可以“开箱即用”地处理文档和通信,也需要大量的提示词工程或上下文收集才能实现可以接受的性能。将其扩展到数百个用例将非常困难,因为这会需要注释数据、进行基准测试、部署,以及维护数百个提示词。
自建 IDP 系统还涉及许多隐藏的成本。系统的每个组件都是一个重要的决定,每种技术都需要专门的技能,从而增加技术债务并增加风险。必须承认,自建是一个沉重的负担,需要更长的时间才能实现价值。由于人才、治理和维护要求,整个生命周期的成本可能更高。根据 Forrester 为 UiPath 提供的分析,69% 的技术决策者认为文档提取和分配用例非常难部署。
购买 IDP 系统的优势
自建系统的替代方案就是从第三方供应商处购买 IDP 服务。主要有两种方法:
购买 IDP 用作单点解决方案,将其与企业技术堆栈的其余部分进行集成。
购买 IDP 作为更大的解决方案或平台的一部分。这样一来,企业就可以使用其他功能,例如按需进行自动化。
购买 IDP 服务会让企业对平台开发的控制权低于定制系统。但是,平台提供商将与客户合作,以确保系统随着客户需求的变化而演变。还有其他许多优势需要考虑:
价值实现时间
实施现有的 IDP 平台通常比开发新的平台更快。大型企业中使用的成熟的平台,经过多种用例的测试,有多年积淀,培训和支持资源也是现成的。在许多情况下,专业服务支持帮助用户快速启动业务,从其实施中产生价值。
基础的 GenAI 系统需要昂贵耗时的微调和提示词工程才能进行商业应用。相比之下,IDP 服务底层的 AI 通常围绕快速、低代码的训练体验设计。针对 IDP 功能,UiPath Document Understanding™ 和 Communications Mining™ 能够进行主动学习,让普通业务用户和 AI 模型协同合作,加速训练过程。
降低风险
选择 IDP 服务大大降低了各种形式的风险。企业不再需要依赖昂贵的人才来维持 IDP 系统的运行。供应商将负责系统维护以及平台和模型的治理。同时,IDP 解决方案提供商还应确保提供高级别的企业级数据安全。
此外,企业还应考虑拥有成本。匆忙开发、不完善的代码,或在自建 IDP 系统中使用即将过时的技术,都会增加技术债务的风险。随着时间的推移,这些都将需要成本高昂的修正和系统升级才能解决。
购买 IDP 服务大大降低了买方的风险和技术债务。为保持竞争力,供应商会优先考虑技术升级,采用最新的功能,不断迭代和改进其服务,处理必要的返工、测试、更新和更换过时的组件。
不要尝试自行构建模型。引人注目的标题会让事情看上去比实际操作要简单。应该寻找在 LLM 热潮之前就已涉足 AI 的供应商。做这件事情需要在相关的 AI 领域具备能力,比如无监督学习、数据准备和基础机器学习计算。
—— Simon Knowles,Vabble 技术负责人
可扩展性
定制系统需要定制的连接器和 API 才能与相关的企业系统集成。根据业务的规模和复杂性,这可能需要数百甚至数千个综合开发小时。成熟的 IDP 平台将为最热门的企业系统提供预制的连接器,实现快速集成和价值实现。使用基于云的 IDP 系统,您还可以期待获得最新的 AI 升级和功能,而无需承担构建或集成这些功能的成本。
综上所述,企业要寻求快速价值实现、准确性和可靠性,“IDP 即服务”是第一选择。自建 IDP 很可能会带来相当大的技术债务,以及长期的风险和责任,而选择 IDP 服务可以将这些负担转移给经过多年竞争和迭代的专业平台。
扩展 AI 和 IDP 的企业级平台
企业要安全和成功地实施 AI 和 IDP 解决方案, UiPath 的企业级平台是一种理想选择。IDP 功能嵌入在我们的端到端自动化框架中,用户可以借此实现文档和通信处理的自动化。您还可以利用预先构建的功能并自定义这些服务,或根据需要引入自有和第三方组件。
UiPath 业务自动化平台提供了 IDP 解决方案,以及大量平台功能和对 GenAI 模型的控制,让它们能在整个企业中快速扩展:
企业级
UiPath 的第一方模型经过严格的企业控制。UiPath 平台提供了基于规则的访问控制(RBAC)、模型版本控制和广泛性能防护措施,为第一方文档理解和通信挖掘模型提供保障。“人在回路”也内置于平台体验之中,确保生成的输出结果经过适当的验证。
此外,UiPath 通过 UiPath AI Trust Layer 管理所有第三方模型,为 GenAI 提供治理、信任和安全功能。这意味着不保留任何数据,外部模型的训练也不会使用您的业务数据。
灵活、开放的模型策略
AI 模型发展迅速,目前最适合的模型可能在六个月后就不再适合您的用例。我们不断投资于开发适合核心业务流程的专业 LLM,并不断改进这些模型。我们面向 IDP 推出的 CommPath 和 DocPath 就是这种持续改进的例子。
与此同时,我们的 AI 战略依旧保持开放。我们提供所需的工具,以便您集成偏好的第三方或专有 LLM,并在 UiPath AI Trust Layer 下进行管理。使用 UiPath,您可以灵活地根据每个用例的需求,组合使用最适宜的模型来完成各种任务。
准确性和可靠性优化
我们的 IDP 能力针对高级数据提取进行了优化,采用了如检索增强生成(RAG)和精心设计的系统提示词等技术。上下文基础确保了 IDP 模型更加安全、性能更佳、准确性更高。我们的 Validation Station 界面展示了提取信息在文档中的来源,这意味着生成的输出可以通过证据轻松验证。
项目经验
我们的创新基于在大型企业中的真实 IDP 部署经验。用户只需定义文档类型,即可利用多个模型。他们还可以评估性能、监控和管理模型版本——这些都是部署 AI 、维护并在业务中扩展的关键能力。
一个体验到 UiPath IDP 能力好处的客户是全美排名前 20 的互保公司 Encova Insurance。为了自动化理赔发票处理,Encova 最初开发了自己的 IDP 解决方案,该解决方案基于传统的光学字符识别(OCR)和第三方 AI 语言理解模型。然而,他们甫一采用 UiPath 平台,就立即意识到准确性的显著提升:
对于文档理解来说,传统的光学字符识别技术能够顺利处理 40% 的文档,另外 30% 的文档则仅完成了一部分。使用这个新的 [UiPath] 流程后,成功率达到了 99%。
—— Jeffrey Martin,Encova 解决方案架构师
UiPath 的 IDP 能力为 Encova 的财务、销售、承保、运营和客户支持部门带来了迅速的价值和显著的效率提升。例如,在其保单录入程序中,手动数据输入时间减少了 98%。在商业线背书中,同样实现了 95% 的年度处理时间缩减。
IDC MarketScape 在最近的全球非结构化智能文档处理软件 2024 年度报告中指出:
“UiPath 将生成式 AI 和 LLM 视为关键技术工具,并越来越多地将它们整合到其 IDP、通讯挖掘和自动化产品组合的所有阶段中……此外,UiPath 继续优先考虑和部署企业级安全性、隐私、访问、上下文基础和控制功能,以确保生成式 AI 模型和服务能够在支持关键业务用例时安全可靠地使用。”
报告还评论道:“UiPath 的多模态 AI 关注点使其具备战略优势,能够不断推动新的方法和策略,以最大化传统(即预测性 AI)和生成式 AI 在非结构化 IDP 中的价值。”
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-23
用国产AI Deepseek做合同审查,强的一批!
2025-01-23
拥抱AI,实现知识管理的个性化与智能化飞跃
2025-01-22
打造高效私有化知识库:MaxKB、Ollama与Llama3的完美结合
2025-01-15
瓴羊Dataphin:AI驱动的数据治理——千里之行,始于标准
2025-01-15
阿里数据治理进化论:基于瓴羊Dataphin的多引擎兼容与统一资产消费实践
2025-01-09
企业级AI搜索,美梦与现实
2025-01-07
OpenSPG/KAG v0.6 发布,兼顾事实推理与摘要生成,支持用户自定义 Schema
2025-01-07
很多人没看懂腾讯ima的逻辑
2024-07-10
2024-04-24
2024-09-14
2024-11-07
2024-05-15
2024-06-23
2024-08-04
2024-07-10
2024-06-19
2024-07-10