我要投稿

RPA vs Agent

发布日期：2024-05-27 22:02:29 浏览次数： 2620

作者：下维NextDimension

微信搜一搜，关注“下维NextDimension”

Antti Karjalainen
Co-Founder@Sema4ai

企业自动化的风潮已久，乍一看RPA和AGENT似乎同根同源，都是承接自动化的产物，但是“大脑”的变化将带来巨大差异。

翻译，整理，微调 by 付子豪（Sio FU）；封面 by GPT4o

技术演变：从规则驱动的RPA升级到能处理复杂知识工作的AI Agent。
优势对比：AI Agent比RPA更具灵活性和适应性，能处理非结构化数据和自我修正。
实施路径：从战术性自动化开始，逐步过渡到战略性AI Agent应用。

AI Agent：引领企业自动化新浪潮

从RPA到Agent，任务自动化走向真实的工作自动化

AI Agent，这一由大型语言模型（LLMs）驱动的软件新范式，正以类似人类的方式进行推理、协作和行动。自RPA技术兴起十年后，我们即将迎来企业自动化的新转变，即由大语言模型（LLM）驱动的智能AI Agent。这些Agent不仅仅是自动化技术的进一步提升，而是一种全新的突破性技术。同样，它也需要我们掌握全新的技能和工具。AI Agent将自动化所涉及的范围从单一任务方向扩展到了复杂知识工作的自动化和增强。

从RPA过渡到AI Agent，这不仅是一次技术升级，更是一项需要高层支持才能成功的战略行动。在本文中，我们将探讨从RPA向企业AI Agent转型的一些实际意义。

企业自动化的演进路径：

任务自动化 —— RPA
流程自动化 —— 自动化即代码（Automation as Code）
工作自动化 —— 智能AI Agent

超越RPA，迈向智能自动化

适应性，弹性，Agent的Reasoning能力仍然是核心

企业自动化正在经历一场演变。它始于机器人流程自动化（RPA），并在2010年代中期因UiPath等公司推广开来。记录和回放式用户界面自动化推动了 RPA 的崛起，并促进了低代码业务应用程序的蓬勃发展。

尽管最初有人对RPA的稳定性和Bot自动化的持久性表示怀疑，但现在，几乎所有大型企业都建立了自动化卓越中心（CoE），并拓展到了通常所说的智能自动化（IA）领域。

IA并不是一个明确定义的术语，通常是 RPA、API 自动化和通过 OCR 进行文档处理等技术的混合体。它标志着从点击式自动化向使用工具的流程自动化的转变，这些工具通常结合了编码和低代码技术，需要专业技能来部署。然而，基本原则仍然相同--RPA 和 IA 纯粹基于规则，适用于定义明确、高度结构化的流程。

与此相反，AI Agent采用了一种完全不同的规划和执行工作流程。它们能够直接理解非结构化数据和流程，这得益于它们灵活的推理能力。这使得AI Agent适用于那些无法简单用规则定义，而需要用自然语言运行手册和工作指南来描述的工作。因此，AI Agent也比预编程的机器人更具弹性——它们可以在遇到错误时自我修正，或向人类寻求反馈。

从战术性自动化到战略性AI Agent
尽管AI Agent在企业自动化方面采取了截然不同的方法，但它们并不是RPA的终结。如果你的任务是每天向生产ERP系统输入一千条记录，或者将十万条电子健康记录迁移到新系统，那么就没有必要试图让Agent来解决重复性的日常任务。如果你手里只有一把锤子，那么你知道接下来会发生什么?你会觉得一切都像钉子。

将AI能力逐渐引入企业工作流程的过程也是如此，如Dr.Andrew所说：在构建复杂的工作流程时，我看到开发人员使用这一流程取得了很好的效果：
    - 编写快速、简单的提示词，看看效果如何。
    - 根据输出的不足，反复充实提示内容。这通常会产生一个更长、更详细的提示词，甚至是一个大型提示词。
    - 如果仍然不够，可以考虑少样本或多样本学习（如果适用），或者进行微调，这种情况比较少见。
    - 如果这仍然不能产生你所需要的结果，那就把任务分解成子任务，并应用代理工作流程。

四种提升HumanEval 编码基准测试中表现的策略[1]

AI Agent扩大了企业自动化的范畴，超越了以往的可能性。由于AI Agent是一个仍在发展中的新类别，在思考Agent的用例时，最简单方法是将Agent的推理能力扩展现有的自动化例程。随着时间的推移，AI Agent将逐渐扩展到企业的核心业务流程中。

上图显示了三种不同类别的自动化用例。最底层是大量的基础且重复性的工作，这些工作不需要复杂的决策，而是在定制的环境中运行。也就是说，这些工作是在数据、文件和系统的基础上进行的，而这些数据、文件和系统对于相关企业来说是非常特殊的。

这是RPA的用武之地，也是开始第一个AI Agent项目的理想起点。在RPA流程的前后寻找机会，并利用AI Agent扩大自动化的范围。利用AI Agent将自动化的范围，使其超出标准 RPA 所能实现的范围。

向上一层，金字塔的中层包含那些在标准上下文中进行标准决策的工作。这类工作通常由ServiceNow或Salesforce等服务记录系统和平台所捕获。在这种情况下，最好从这些供应商那里购买AI和自动化解决方案，并依靠他们对自己拥有的数据和流程进行创新。现在，每个应用都有一个Copilot。

最后，在金字塔的顶端，我们有最战略性类别的工作，这些工作对企业的核心业务和运作方式至关重要。这些工作涉及复杂的决策，并在自定义上下文背景中运行。没有人能够从外部进入并教导我们如何更好地完成这项工作，因为这正是公司存在的原因。这正是定制化企业AI Agent将产生最大影响的地方。

AI Agent可以与人类并肩工作，或取代一些人类任务，使人们能够专注于更有成效的工作。对于非AI行业来说，智能AI Agent的这个概念仍然处于早期阶段，因此要完成这项最有价值、最具战略性的工作尚需时日，但现在正是开始构建实现这一目标所需的技能和平台的大好时机。

企业迈向AI之路的三个步骤

现在，要开始企业AI Agent之旅，首先要做的是：

建立AI治理和安全指导原则

我们如何控制AI的使用，如何允许我们的数据被AI应用所使用，以及我们如何确保AI不会成为安全的威胁？这是每个企业都必须进行的基础工作，并为AI实验设定明确的规则。目前已经看到围绕AI治理的行业最佳实践的出现，这个话题值得单独深入探讨。

定义时间线和成功标准，并为成功调整组织结构

第二步是设定正确的期望、时间线和战略愿景。“到年底，我们已经确定了三个AI Agent并构建完成，它们将在日常运营中发挥作用。我们的愿景是在未来两年内成为一个由AI驱动的企业，并将AI Agent应用于我们的核心业务流程。” 以明确的时间线和合理的期望开始，可以让组织在与代理的学习和提高过程中取得早期胜利。一个战略愿景声明是必要的，以确保我们保持正确的方向，产生正确的影响。高级管理层的支持对于项目的成功至关重要。

识别用例，从战术性自动化开始，逐步提升到战略性

研究现有的自动化流程，确定第一个AI Agent用例，或者思考当前自动化前后的工作流程。这些是开始为Agent收集想法的好地方，并避免那些处于我们用例金字塔中间层的用例。对公司的最战略性用例有一个清晰的认识，但要从小事做起，以便能够保持时间表并促进学习。

AI和Agent技术正在快速发展，新的突破和大型语言模型（LLMs）正在不断涌现。为了在市场上保持竞争力，避免过早地锁定在特定的技术或LLM供应商上是明智的。相反，寻找在其产品中采用开源技术的供应商，因为开源技术正在引领AI Agent的创新。

现在是采取行动的时刻
AI Agent是一项全新的突破性技术，而不是传统自动化的简单升级。传统上，我们对自动化和AI的策略是规划未来的大事件，同时应对目前的挑战。然而，生成式AI的快速发展速度要求我们对这种方法进行关键的调整。未来不是在两年后，而是现在。

作为企业自动化的领导者，将重点从遥远的未来转移到立即实施AI技术至关重要。等待适应意味着错失了AI目前提供的竞争优势。许多具有前瞻性的公司已经从他们正在构建的AI项目中获得了获得了巨大的收益。

AI Insights From Sio

?AI+Office ，2024 Q1
?红杉Arc课程的PMF框架
?AI+Office，这一年。
?万字长文！何谓MoE，为何MoE？
✏Notion AI视角下的 Humans in the Loop
?AI应用层P和M到底怎样F？
?万字长文！何谓Agent，为何Agent？

Reference：
[1].https://www.deeplearning.ai/the-batch/
[2].https://medium.com/sema4-ai/

※Mistakes&Opinions my own, and not of my employer.※

欢迎评论，讨论，请点击“在看”和“赞”，戳我试试吧

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业