微信扫码
添加专属顾问
我要投稿
深入解析智能体工作流的设计与应用,揭示大模型在业务场景中的高效利用。核心内容:1. 智能体工作流的必要性与大模型迭代优化的效果2. 智能体工作流与传统工作流的区别及优势3. 智能体型工作流的关键步骤与实际应用案例
过去两年中基础模型快速发展,从大语言模型到多模态模型、再到推理模型,大模型的能力不断提升。基于大模型的智能体也在不断发展,智能体可以更好与业务场景结合,发挥出大模型的价值。本文探讨智能体工作流并分析智能体工作流的常见设计模式。
01 为什么需要智能体工作流?
目前大多数人都是直接使用大模型,即大模型根据提示生成最终输出,而且不做任何修改。这好比是要求人从头到尾直接写出一篇完整的文章,难度无疑是非常大的。但是根据人类作者的通常做法来看,写文章的过程是反复迭代优化,最终才能产出一篇文章。
根据人工智能学者、斯坦福大学教授吴恩达的研究发现,GPT-3.5零样本模式的输出正确率为48.1%,GPT-4零样本模式的输出正确率更高,达到了67.0%,然而其表现相差并不是很大。但是,通过引入迭代智能体工作流(采用反思模式),GPT-3.5的正确率就可以高达95.1%。
由此可见,相比直接使用大模型的方式,智能体工作流通过多次迭代,可以逐步构建出更高质量的输出。
02 智能体工作流
工作流(Workflow)是指为完成特定任务或目标所采取的一系列相互关联的步骤。工作流并不是新出现的,当前企业信息系统中就存在很多自动化工作流。这种传统的工作流是确定性的(Deterministic),即它们遵循预定义的步骤序列,业务规则也是预定义好的,每次都是重复执行。以自动化的报销审批工作流为例,如果费用标签为“餐饮”,且金额小于$30,则自动批准。
随着大模型到来,一些工作流会使用大型语言模型(LLMs)或其他机器学习模型来增强其能力,这些工作流通常被称为 AI 工作流。AI工作流又可分为智能体型(Agentic)和非智能体型(Non-Agentic)两种。
非智能体型工作流(Non-Agentic Workflow)遵循预定义的工作步骤,只是在步骤中会调用大模型,大模型根据输入的指令产生输出。非智能体型工作流可预测性较强,适合于预定义的重复任务。可见非智能体型工作流本质上还是传统工作流,只是增加了大模型的直接调用。
智能体型工作流(Agentic Workflow)是为完成特定任务或目标由一个或多个智能体来动态执行一系列步骤。智能体型工作流更具动态性、自主性、适应性。大模型可以自主决定流程、选择工具并确定任务完成方式。
智能体型工作流可以使用智能体的推理能力、工具使用能力和持久记忆能力,来开展如下工作:
1.制定计划(Make a plan)。智能体型工作流从规划开始。LLM 负责任务分解(Task Decomposition),将复杂任务拆解为更小的子任务,并确定最佳执行路径。
2.使用工具执行任务(Execute actions with tools)。智能体型工作流使用一系列预定义工具(如 API、数据库、搜索引擎等),并配合相应的权限管理,以执行任务并实施规划方案。
3.反思和迭代(Reflect and iterate)。智能体可以在每个步骤评估结果,如有必要调整计划,并反复执行,直到得到满意的结果。
下图是三类工作流的示例:
可以看到,传统非AI工作流执行预定义步骤和固定的业务规则,每次发生变化都需要调整工作流。非智能体型AI工作流使用了大模型,但不具备自主性和动态性。智能体型工作流可以使用智能体动态执行任务,具备自主性、动态性和适应性。
从适用的问题领域来看,传统非AI工作流和非智能体型AI工作流更适合步骤固定、规则明确的场景,智能体型AI工作流适合于需要动态决策或使用外部工具的场景。
03 智能体型工作流设计模式
设计模式是一种解决软件设计问题的通用解决方案,它提供了一种可重用的模版,可以帮助开发人员构建更健壮、可维护和可扩展的软件系统。
为更好开发智能体型工作流,总结了如下七类设计模式:
1. 链式工作流(Chain Workflow)模式
链式工作流将多个任务按线性序列组织,一个步骤的输出作为下一个步骤的输入。这种模式适用于任务具有明确顺序且每个步骤依赖于前一步输出的场景。
链式工作流将多个步骤按线性序列组织,一个步骤的输出作为下一个步骤的输入。它适用于具有明确顺序步骤的任务,每个步骤都基于上一步的输出,形成一个连续的处理链条,逐步提升任务处理的准确性。链式工作流模式对于任务的控制非常强,且具备一定的适应性。
例如,在新闻推荐系统中,工作流可能首先检索用户偏好,然后将这些偏好作为输入来获取和分析新闻。这是一个典型的链式任务,其中用户偏好的输出直接作为新闻检索的输入。
适用场景:
任务具有明确的顺序步骤;
需要通过延迟换取更高的准确性;
每个步骤依赖于上一步的输出。
2.并行工作流(Parallel Workflow)模式
并行工作流通过同时执行多个任务或处理多个数据集来提高效率,适合处理大量独立数据或多个请求的场景,如大数据分析、实时监控和复杂决策支持系统。这种模式适用于可以独立并同时进行的任务,使得系统资源得到充分利用,从而减少总体处理时间。
例如,一个金融分析助手可能需要同时分析股票市场、外汇市场和商品市场的数据。通过将这些分析任务分配给不同的LLM调用(如LLM Call 1、LLM Call 2和LLM Call 3),每个调用可以并行处理其分配的市场数据。然后,一个聚合器组件将收集这些并行任务的结果,并整合成一个全面的分析报告。
适用场景:
处理大量相似但独立的项目;
需要多个独立视角的任务;
任务可并行化且对处理时间要求较高。
3.路由工作流(Routing Workflow)模式
路由工作流根据输入条件动态选择执行路径,将任务路由到不同的处理流程。这种模式适合任务输入复杂且不同输入需要专门处理的场景。这样,系统可以在没有预定义序列的情况下适应不同情况。在不同的处理流程中,可以使用不同的大模型来处理,并调用外部工具。
例如,一个金融服务平台可能根据用户感兴趣的主题( 如“crypto” 或“stocks” )将请求路由到不同的API端点。这是路由工作流的一个示例,其中输入的主题决定了请求的路由路径。
适用场景:
任务具有不同输入类别且复杂;
不同输入需要专门处理;
可以准确分类输入。
4.编排器-工作者(Orchestrator-Worker)模式/规划模式(Planning Pattern)
在这种模式下,中央 AI(编排器)负责将任务分解为多个子任务,并分配给专门的子进程(工作者智能体)来并行处理,每个工作者负责不同的功能(例如,数据检索、分析、摘要)。这种模式通过并行处理提高了效率和专业化程度。该模式下的任务分解使用了大模型的推理和规划能力。
例如,在新闻分析项目中,服务可以充当编排器,与AI模型协调新闻检索和分析。AI模型(如OpenAI的ChatModel)作为文本分析的专用工作者,负责处理特定的分析任务。
适用场景:
任务复杂且无法预先预测子任务;
需要不同方法或视角的任务;
需要适应性问题解决的情况。
5.评估器-优化器(Evaluator-Optimizer)模式/反思模式(Reflection Pattern)
该模式通过使用大模型进行迭代评估和优化来不断改进任务处理效果。评估器负责评估智能体输出的质量,优化器则根据反馈进行改进,从而随着时间推移提高准确性。
大模型反思有三种反思方式——自我反思、交叉反思和人类反思。自我反思是针对大模型输出受幻觉影响、缺乏可解释性的情况,智能体进行自我评估,反思并改进输出。交叉反思是针对大模型本身能力有限、缺乏可解释性的情况,在大模型之间进行相互反思。人类反思则是由用户或专家评估和提供反馈。
评估器-优化器模式使用的是交叉反思,大模型B对大模型A的输出进行反思。
例如,在新闻内容分析中,可以通过AI模型总结和分析新闻,这可以视为一种内容评估和改进的形式。AI模型不断评估新闻内容的质量,并根据评估结果优化分析策略。
另外一个例子是代码生成,通过大模型生成代码,然后在沙盒或执行环境中运行代码,获取出错信息并反馈给大模型,大模型会迭代优化代码直到成功运行。
适用场景:
存在明确的评估标准;
迭代优化可以提供可衡量的价值;
任务受益于多轮反馈和优化。
6. 工具使用模式(Tool Use Pattern)
工具使用模式允许智能体通过调用外部工具(如搜索引擎、代码执行平台、向量数据库等)来扩展自身能力,从而做出在特定任务上达到更高的效率和准确性。
检索增强生成(RAG)是典型的工具使用模式,通过引入相关的、实时的外部向量数据库来增强大模型的响应准确性,有效解决了幻觉问题,而且提高了响应的专业性。
通过使用外部工具,智能体可以完成一系列任务,比如自动发送邮件、查询合适的机票并完成机票预订、通过网络搜索获得最新的信息等。比如最近火爆的通用智能体Manus就是通过集成使用29种外部工具,实现灵活调用工具并完成各类任务。
工具使用模式对于企业智能化改造非常关键。企业可以应用工具使用模式将现有的信息系统能力API化之后结合到智能体中,实现企业IT资产的有效利用。
大模型调用外部工具时可以使用硬编码方式,也可以使用Function Calling(见《大模型核心技术:使用OpenAI Function Calling调用外部函数》)和MCP协议(见《重塑AI应用新范式:Athropic MCP架构深度解析》)来完成对外部工具的集成。
适用场景:
需要实时数据支持或依赖外部资源的任务。
7.多智能体协作(Multi-Agent Collaboration Pattern)
多智能体协作模式重视多个智能体之间的协作。每个智能体被赋予特定角色,互相交流信息并协调行动,从而共同完成复杂任务。通过与其他智能体的交互和协作,可以提高整体的执行效率和解决问题的能力。虽然当前多智能体系统的应用仍在探索中,但像ChatDev这样的项目初步展现了这一模式的潜在能力。
多智能体协作必然要解决不同智能体之间有不同意见时如何达成一致的问题。有三种机制可以解决这个问题:投票机制、辩论机制以及角色机制。在投票机制中,智能体之间进行投票来达成共识,体现了公平性。在辩论机制中,智能体之间通过辩论来达成共识,体现了适应性和可解释性。在角色机制中,不同智能体分配不同的角色,由角色来负责具体的决策,体现了分工和容错性。
在软件研发场景中,为产品经理、架构师、项目经理、软件工程师、测试工程师等不同角色建立不同的智能体,当智能体之间有不同意见,需要决策时,由不同角色的智能体来进行具体的决策,比如和项目立项、进展和上线有关的由项目经理智能体决策,代码编写和bug修复相关的由软件工程师智能体决策。
适用场景:
任务复杂;
由不同技能、角色协同完成。
04 总结
与传统的非AI工作流相比,智能体型工作流擅长处理步骤和规则不太明确的任务,具有自主性、动态性和适应性。企业在设计智能体型工作流时,可以使用链式工作流模式、并行工作流模式、路由工作流模式、编排器-工作者模式和评估器-优化器模式、工具使用模式和多智能体协作模式等七类设计模式,提高设计的效率和系统的健壮性、可维护性和可扩展性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-16
Claude 推出高级 Research 功能,并深度集成 Google Workspace
2025-04-16
GPT-4.1一手实测,实力绝对被低估了
2025-04-16
这些你不知道的 OpenAI 4.1 秘密
2025-04-15
前沿导读 | 大模型智能体驱动的社会仿真
2025-04-15
Gemini 2.5 Pro 暴击 OpenAI,性能猛兽不翻车,全球顶尖实至名归
2025-04-15
OpenAI 再放大招!100 万超长上下文的GPT-4.1 横空出世
2025-04-15
5W字长文 Agent多智能体探秘:架构设计、交互模式与应用实践深度剖析
2025-04-15
刚刚,OpenAI 发布 GPT-4.1 !吊打 GPT-4.5,14 万/月的博士级 AI 曝光
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-13
2025-04-13
2025-04-13
2025-04-12
2025-04-12
2025-04-11
2025-04-11
2025-04-10