AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


大模型驱动商业流程自动化,利用Text2Workflow实现高效业务流程管理
发布日期:2024-12-06 08:19:42 浏览次数: 1640 来源:大噬元兽


业务流程自动化是企业提高效率、减少错误和节约成本的重要工具,传统的机器人流程自动化(RPA)通过执行预先编写的脚本来自动化重复性任务,从而在减少人工干预的同时加快业务流程。然而随着业务环境的复杂化和动态变化,RPA的局限性也愈发明显。12 月 5 日,arXiv发表的论文《From Words to Workflows: Automating Business Processes》深入探讨这些局限性,并介绍新兴的生成型人工智能(GenAI)和大型语言模型(LLM)在业务流程自动化中的应用前景。


自动化技术的引入,使得企业能够显著提升运营效率和准确性。通过自动化重复性和耗时的任务,员工可以将更多精力投入到战略性和创新性的工作中,从而推动企业的整体发展。特别是在处理大量数据和需要快速响应的业务场景中,自动化的作用尤为关键。自动化不仅减少了人为错误,还能通过标准化流程提高一致性和合规性。因此,自动化在现代企业的运营中扮演着不可或缺的角色。


尽管RPA在提高操作效率方面表现出色,但其在处理复杂和未结构化数据、应对动态环境变化方面存在明显不足。首先RPA依赖于预定义的规则和脚本,这意味着当面对非结构化数据或异常情况时,RPA系统往往无能为力。其次,RPA的实施和维护需要高度专业的编码和业务流程知识,这增加了成本和复杂性。此外,RPA在处理需要高级决策的任务时表现出认知能力的不足,难以适应业务流程中的动态变化。这些局限性促使人们寻求更智能和适应性更强的自动化解决方案。


研究团队认为,随着人工智能技术的迅猛发展,生成型人工智能(GenAI)和大型语言模型(LLM)为业务流程自动化带来了新的希望。GenAI能够生成新的数据输出,如文本、图像和音频,超越了传统数据分析的范畴。而LLM,如OpenAI的GPT系列,通过理解和生成自然语言文本,展示了强大的语言处理能力。这些技术的结合,为实现更智能的流程自动化提供了可能。


相比传统的RPA,GenAI和LLM能够处理更加复杂和动态的任务。例如,LLM可以通过自然语言理解用户需求,并自动生成相应的工作流程。此外,借助机器学习和数据分析技术,这些智能系统可以不断学习和优化流程,提高自动化的适应性和准确性。因此GenAI和LLM的引入,使得业务流程自动化的应用前景更加广阔和多样化。


论文的研究团队来自位于法国巴黎的Novelis研究与创新实验室。团队成员包括Laura Minkova、Jessica López Espejel、Taki Eddine Toufik Djaidja、Walid Dahhane和El Hassane Ettifouri。他们的实验室致力于通过创新技术和研究,专注于材料科学、环境可持续性、能源效率和产品创新等领域,不仅提升了产品性能,还努力减少生产过程中的环境影响,推动行业向更加绿色和可持续的方向发展。这个研究团队结合了在人工智能、业务流程管理和软件工程方面的丰富知识与经验,为本研究提供了坚实的技术支持和学术背景。他们的工作不仅提升了业务流程的自动化水平,还为企业实现智能化运营提供了新的路径。


相关工作


机器人流程自动化(RPA)的发展与局限性


机器人流程自动化(RPA)自诞生以来,就为业务流程的自动化带来了显著的改变。RPA是一组技术工具,通过执行独立运行于软件系统上的代码来自动化业务流程。它允许企业在提高操作效率的同时,减少人为错误,并且具有高度的可扩展性。由于RPA能够处理大量重复性任务,企业可以显著降低劳动力成本,同时提高生产力。最重要的是,RPA释放了员工的时间,使他们能够专注于更具战略性和创造性的任务,推动组织内的创新和价值创造。


然而,RPA也存在明显的局限性。首先RPA系统依赖于预定义的规则和脚本,因此在处理复杂决策任务时表现欠佳。当系统遇到意外错误或挑战时,RPA代理往往无法确定适当的下一步,导致流程中断。其次,RPA的实施和维护需要高度专业的编码和业务流程知识,增加了成本和复杂性。特别是随着业务流程的演变,维护成本可能远远超过最初的预测。尽管RPA在某些场景中表现出色,但其认知能力的不足和对专家知识的高度依赖,使其在面对动态变化和复杂任务时,显得力不从心。


生成型人工智能(GenAI)文本生成的发展


生成型人工智能(GenAI)是近年来快速发展的一个领域,特别是在自然语言处理(NLP)方面取得了显著进展。GenAI通过生成新的数据输出,如文本、图像和音频,超越了传统数据分析的范畴。在Transformer架构引入之前,生成型人工智能主要依赖于递归神经网络(RNN)和长短期记忆(LSTM)模型。这些模型在处理序列数据和自然语言处理任务方面取得了一定的成功。例如,RNN在处理时间序列分析和自然语言处理方面有广泛应用,而LSTM则解决了RNN处理长序列数据时的主要局限。


然而,真正的突破出现在Transformer架构的引入。Transformer模型通过自注意机制,大幅提升了处理序列数据的效率和准确性,推动了如BERT和GPT等模型的发展。基于Transformer架构的大型语言模型(LLM)展示了强大的自然语言理解和生成能力,能够处理从文本生成到复杂任务规划等多种任务。这些模型不仅在文本生成方面表现出色,还能在零样本和少样本学习方面展示出色的泛化能力,使其能够快速适应新任务。此外,生成对抗网络(GAN)和变分自编码器(VAE)等模型也在生成型人工智能领域取得了重要进展,进一步扩展了GenAI的应用范围。


工作流自动化的现有研究


在工作流自动化领域,现有研究主要集中在行动计划和调度、代码生成与JSON生成等方面。行动计划和调度的研究大多集中于物理机器人和具身人工智能,这些研究探索了机器人如何在复杂环境中进行任务规划和执行。例如,Valmeekam等人的研究考察了大型语言模型在常识任务规划中的推理能力,尽管这些能力仍然有限,但展示了LLM在规划任务中的潜力。


代码生成与JSON生成的研究则进一步拓展了工作流自动化的应用场景。通过语言模型生成代码,能够自动化生成业务流程所需的程序,这对于实现复杂业务流程的自动化至关重要。例如,Chen等人的研究展示了通过微调GPT模型生成Python代码的能力,使其能够处理复杂的编程任务。此外,EvalPlus等框架的引入,进一步增强了生成代码的评估和优化能力,提高了自动化工作流的准确性和效率。


方法论


Text2Workflow是一种创新的方法,旨在通过自然语言请求自动生成业务流程的工作流。这一方法结合了生成型人工智能(GenAI)和大型语言模型(LLM)的优势,能够将用户的自然语言输入转换为可执行的JSON格式工作流。与传统的自动化方法不同,Text2Workflow提供了一种通用解决方案,适用于各种业务流程,极大地简化了工作流的创建和执行过程。


图1:JSON通用流程。


JSON基础结构在Text2Workflow中的应用


为了有效地将自然语言请求转换为工作流,Text2Workflow采用了预定义的JSON输出结构。这一结构分为通用流程部分和步骤特定部分,每个部分都有其独特的键和格式,以确保工作的标准化和可读性。通用流程部分包含流程的元数据和整体信息,如流程的唯一标识符(UUID)、名称、描述和参数等。而步骤特定部分则详细描述了每个具体步骤的操作和参数,使得工作流的执行更加灵活和细致。


输出结构的描述


在Text2Workflow中,JSON工作流的输出结构被设计为能够适应多种业务流程。通用流程部分包括流程的唯一标识符、名称、描述和参数等信息,用于概述整个流程。而步骤特定部分则包含具体的执行步骤,每个步骤有其特定的类型,如Decision、Loop、Calculation、DataExtraction、API-type等。


每个步骤类型都有其特定的JSON结构,用于描述该步骤的详细操作。例如,Decision步骤用于决策判断,包含条件和执行路径的定义;Loop步骤用于循环操作,包含循环条件和操作;API-type步骤用于与外部服务的交互,如Outlook、Excel、File、Web和Desktop的操作等。这些步骤类型的定义和使用,使得Text2Workflow能够灵活应对不同类型的业务流程。


为了提高Text2Workflow的准确性和效率,研究团队采用了提示工程技术,设计了多种提示策略。这些提示策略包括少样本提示、连贯思维提示和基于角色的提示,旨在引导模型生成准确和一致的输出。


少样本提示通过提供一组示例,展示所需的输出格式,从而指导模型的生成过程。连贯思维提示则鼓励模型将复杂任务分解为逻辑步骤,以改进其在特定任务上的响应。基于角色的提示通过定义任务或问题的具体角色和情境,使模型能够生成更符合预期的输出。这些提示技术的结合,使得Text2Workflow在处理复杂任务时表现更加出色。


Text2Workflow的总体架构


Text2Workflow的方法分为多个步骤,以确保生成的工作流既符合用户需求,又具备高效的执行能力。这些步骤包括分解创建、用户反馈循环、工作流创建和问题生成、手动完成工作流和工作流修改机制。这些步骤类型使得工作流能够涵盖从基本操作到复杂决策和循环的多种任务。Text2Workflow可以进一步总结为五种主要机制,如下所示:


1.分解创建(图2)


2.用户反馈循环(图3)


3.工作流创建和问题生成(图4)


4.工作流的手动完成(图5)


5.工作流修改(图6)


图2:将自然语言用户请求分解为工作流框架的过程。


图3:用户反馈循环机制,允许用户验证和/或修改工作流框架(如有需要)。


图4:完整的工作流生成,包括验证和创建针对缺失参数的自然问题。


图5:允许用户填写缺失参数以手动完成工作流。


图6:工作流修改机制。


在分解创建阶段,模型首先将自然语言请求分解为工作流框架,然后在用户反馈循环中,用户可以验证和修改生成的工作流框架。接下来,工作流创建和问题生成阶段,模型生成完整的工作流,并验证缺失参数。手动完成工作流阶段,用户可以手动填写缺失的参数。最后,在工作流修改机制中,用户可以提出修改请求,模型将根据这些请求调整工作流。


这些步骤相互协作,构成了Text2Workflow的总体架构,使得这一方法能够高效地将自然语言请求转换为可执行的业务流程工作流。通过这种方法,企业能够大幅提高业务流程的自动化水平,减少人为干预和错误,提高运营效率和准确性。


评估方法


在开发和验证Text2Workflow的过程中,研究团队设计了一套全面的评估方法,确保生成的业务流程工作流不仅高效,而且准确。


为了充分评估Text2Workflow的性能,研究团队构建了一个名为Process2JSON的数据集。这个数据集包含了60个简洁的用户请求示例,这些请求被分为三种复杂性级别:简单、中等和复杂。每个级别包含20个示例,旨在测试Text2Workflow在不同复杂性任务中的表现。


数据集Process2JSON的构建


Process2JSON的数据集是通过收集各种业务场景下的用户请求构建的。这些请求覆盖了广泛的业务流程,从简单的邮件读取到复杂的文件处理和数据提取。数据集中的简单示例通常不涉及决策(Decision)、循环(Loop)或异常(Exception)步骤,而中等示例可能包含这些步骤,但逻辑清晰,解释充分。复杂示例则包含所有类型的步骤,可能涉及嵌套循环、连续决策和隐含步骤。


数据集示例与预期输出


数据集中每个示例都对应一个预期的JSON格式工作流输出。以一个简单示例为例,用户请求读取Outlook收件箱文件夹中最近5封邮件,按日期从“最近到最久”排序。预期输出的JSON将包含读取邮件的步骤,并按指定顺序排列。


在中等示例中,可能要求读取特定文件并提取数据,基于提取的数据进行条件判断,并执行相应操作。复杂示例可能要求处理多个文件,提取特定信息,并根据情况动态调整工作流步骤。


评估标准和指标


为了全面评估Text2Workflow的性能,研究团队设计了三项关键评估指标:生成时间、令牌使用量和JSON准确性。这些指标从不同角度评估了Text2Workflow的效率和输出质量。


生成时间是评估Text2Workflow效率的关键指标。通过测量从接收到用户请求到生成完整工作流所需的时间,可以评估系统的响应速度和处理效率。


令牌使用量则衡量了模型在处理请求过程中消耗的计算资源。由于Text2Workflow依赖于生成型人工智能模型,因此了解令牌使用量对于评估其实际应用中的成本至关重要。研究团队特别关注了每个请求的输入令牌和完成令牌的数量,分析不同复杂性任务的资源消耗情况。


JSON准确性评估了生成的工作流在结构和语义上的正确性。研究团队设定了一套评分标准,从完全正确的输出到存在严重错误的输出进行评估。评分标准不仅考虑了语法正确性,还包括了逻辑连贯性和执行步骤的正确性。


结果与讨论


在实验过程中,Text2Workflow展示了显著的优势和一些需要改进的地方。论文通过对比输入令牌和完成令牌的使用量,以及执行时间和JSON输出的准确性,对其性能进行了全面分析。


研究团队通过对不同复杂性的用户请求进行了实验,分析了Text2Workflow的性能。实验结果显示,不同复杂性任务的输入和完成令牌使用量、执行时间和JSON输出的准确性均存在显著差异。


在处理简单任务时,Text2Workflow消耗的输入令牌相对较少,但随着任务复杂性的增加,输入令牌的使用量显著增加。这主要是因为复杂任务涉及更多的步骤和细节,需要更多的计算资源来生成完整的工作流。与基线模型相比,Text2Workflow在处理复杂任务时的输入令牌使用量增加了约45%。


图7:所有实验和难度级别的完成令牌生成。


与输入令牌类似,完成令牌的使用量也随着任务复杂性的增加而增加。在简单任务中,完成令牌的使用量较少,而在复杂任务中,由于生成的JSON工作流包含更多的步骤和上下文信息,完成令牌的使用量显著增加。Text2Workflow在处理复杂任务时的完成令牌使用量比基线模型高出约79%。


图8:所有实验的执行时间(秒)。


生成时间是评估Text2Workflow效率的关键指标。实验结果显示,Text2Workflow在处理简单任务时,生成时间较短,而在处理复杂任务时,生成时间显著增加。尽管生成时间较长,Text2Workflow的多步骤结构使得整个流程更加系统和有条理,最终生成的工作流也更为准确和详细。


图9:JSON精度结果(以%表示),按难度级别划分。


在JSON输出的准确性方面,Text2Workflow表现出色,尤其是在处理复杂任务时。尽管偶尔会出现错误键或逻辑不一致的情况,Text2Workflow生成的工作流总体上具有较高的准确性和一致性。特别是在复杂任务中,Text2Workflow的准确性明显优于基线模型,证明其在处理复杂业务流程自动化方面具有显著优势。


通过实验分析,可以看出Text2Workflow具有高效的自动化能力和较高的准确性,尤其是在处理复杂业务流程时。然而Text2Workflow也存在一些局限性。


优势方面,Text2Workflow展示了强大的处理能力,能够高效生成准确的业务流程工作流。其多步骤结构和用户反馈循环机制,使得最终生成的工作流既符合用户需求,又具备较高的执行效率。


局限性方面,Text2Workflow在处理某些特定工具和API时,仍存在一定的依赖性,可能会影响工作流的灵活性和通用性。此外,偶尔出现的JSON结构错误键,反映了在模型设计和提示工程上仍有改进空间。特别是当步骤类型或JSON结构发生变化时,需要大量的重新工作来调整提示和模型,这也增加了维护的复杂性。


结论与未来工作


Text2Workflow的提出,为业务流程自动化带来了革命性的变化。通过将生成型人工智能(GenAI)和大型语言模型(LLM)的强大功能结合在一起,Text2Workflow能够自动将自然语言请求转换为可执行的业务工作流。这一创新方法不仅提升了自动化效率,还显著提高了工作流生成的准确性。


Text2Workflow的贡献在于其多方面的优势。首先,它通过智能化的提示工程和用户反馈循环,确保了生成的工作流既符合用户需求,又具备高效的执行能力。其次,Text2Workflow的方法通用性强,能够适应各种复杂的业务流程,展示了在不同应用场景中的广泛适用性。最后,通过使用预定义的JSON结构,Text2Workflow提供了一种标准化的工作流表示方式,极大地简化了工作流的管理和维护。


然而尽管取得了显著进展,Text2Workflow在实际应用中仍面临一些挑战和局限性。未来的工作将致力于解决这些问题,进一步提升系统的性能和适用范围。以下是几个可能的改进方向:


提示的鲁棒性是确保系统在各种场景下都能生成准确工作流的关键。未来的工作可以集中于开发更加灵活和适应性强的提示框架,使其能够应对不同类型的任务和动态变化的业务流程。此外,通过引入更多的示例和上下文信息,可以进一步提高提示的准确性和可靠性。


尽管GPT在生成自然语言文本方面表现出色,但其云服务的特性可能引发一些安全和隐私问题。未来的工作可以探索其他替代方案,如本地部署的生成模型,既能提供同样强大的功能,又能确保数据的安全和隐私。这将使企业在实现自动化的同时,能够更好地控制和保护其数据。


现有的评估方法主要依赖于单一评估者,可能存在一定的偏差。未来的评估可以采用多个评估者的平均或共识评分,以获得更客观的评价结果。此外,开发一种新的评估指标,可以更全面地捕捉系统的性能表现,为进一步优化提供依据。


生成型人工智能和大型语言模型在处理复杂任务时,尤其是在总结和任务理解方面,仍然面临一些挑战。未来的研究可以集中于提升模型在这些方面的能力,使其能够更好地理解用户需求,生成更加精确和连贯的工作流。这不仅提高了系统的智能化水平,也拓展了其在更广泛应用场景中的潜力。(END)


参考资料:https://arxiv.org/abs/2412.03446


波动世界(PoppleWorld)是噬元兽数字容器的一款AI应用,基于意识科学和情绪价值的理论基础,通过AI技术驱动帮助用户进行情绪管理的工具和传递情绪价值的社交产品,波动世界将人的意识和情绪作为研究和应用的对象,探索人的意识机制和特征,培养人的意识技能和习惯,满足人的意识体验和意义,提高人的自我意识、自我管理、自我调节、自我表达和自我实现的能力,让人获得真正的自由快乐和内在的力量。波动世界将建立一个指导我们的情绪和反应的价值体系。这是一款针对普通人的基于人类认知和行为模式的情感管理Dapp应用程序。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询