微信扫码
与创始人交个朋友
我要投稿
工作流是搭建Bot智能体的一种很重要的技能,稍微复杂或比较实用的Bot基本上都使用了工作流。本文从工作流概念讲起,然后介绍扣子工作流的结构,最后以一个示例结尾,便于小白用户透彻掌握。
内容如下:
1.扣子工作流简介
什么是工作流?
工作流(Workflow)是指一系列相互关联的步骤或任务,用于完成特定的业务过程或项目。它定义了任务的顺序、执行者以及相关的条件和规则,以确保流程的顺利进行和最终目标的达成。
工作流在日常工作中很常见,比如:财务报销要经过填写报销单、提交发票、财务审核、分管领导审核等步骤,就是典型的工作流;软件开发领域的CI/CD流水线也是一种工作流。
扣子的工作流与传统工作流类似,但也有不同之处。传统工作流既可以手动、也可以自动执行,或者二者结合。扣子的工作流是一种自动执行多个相关步骤的可复用流程,一个Bot可以使用多个工作流,Bot可以根据用户的行为选择并执行不同的工作流。
扣子工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。
说到这里,有一个很自然的疑问:既然Bot是基于大模型搭建的,为什么大模型不直接把相关的任务执行了,告诉我们结果就行?还要引入一个工作流?
原因也很简单,虽然现在的大模型比较智能,但是还没有那么智能!大模型(或者说生成式AI)是基于概率来生成内容,这就意味着它并不是每次都能给出符合要求的结果,特别是对返回结果要求比较精确的场景。
工作流是对当前大模型能力不足的一种补偿机制,在大模型智能化程度还不够高的时候,通过人为编排的工作流(注入人的智能),让智能体具有更高的可用性和可靠性,提升用户体验。
2.扣子工作流能解决什么问题?
既然我们已经对扣子的工作流有所了解了,那么工作流能解决什么问题?或者说在什么情况要使用工作流?根据自己的理解给出一些建议:
1.使用提示词无法达到预期效果
在Coze平台搭建Bot智能体时,一般是先从编写提示词开始。有时候我们按照提示词工程技巧编写了清晰明确的结构化指令,经过反复迭代优化,仍然达不到预期效果,那么可以考虑采用工作流。比如长文本写作(调研报告),先是要收集相关资料,生成写作大纲、划分各个章节,再对各章节进一步收集资料、逐步生成章节内容, 最后是总结。仅仅通过提示词,大模型可能难以产生一篇结构合理、内容翔实的文章,这时候可以通过工作流来实现。
2.需要多次调用插件或外部工具的场景
有些大模型具有Function call能力,可以调用外部工具。但如果需要调用多个外部工具,且他们具有严格依赖关系时,大模型可能不是每次都能很好地完成目标。比如根据一个url,获取网页内容、总结要点、生成思维导图的任务中,“网页内容抓取”、“生成思维导图”两个步骤都需要调用外部工具(插件),中间还需要大模型来总结要点,这个可以通过工作流来实现。
3.需要使用代码加工数据或生成响应
大模型虽然能够产出还不错的内容,但是很难对数据进行精确处理,在这种情况下,可以使用工作流中的代码节点来解决。Coze官方文档中,介绍了一个使用工作流和代码节点生成随机数的例子。
4.需要根据某个条件执行不同的分支处理
比如做一个答题Bot,根据用户选择的不同选项,来回复不同的内容。
5.需要在一次用户请求中多次输出消息
大模型的工作方式是一问一答,即根据输入产生输出。在一些比较复杂的应用中,可能需要对一次用户的问题,回复多条消息;或者一次完整输出的耗时比较长,为了提高用户体验,需要分为多次输出。可以在工作流中使用消息节点来产生多次输出消息。
3.扣子工作流的逻辑结构
简单来说,扣子工作流是一个有唯一输入和唯一输出的有向无环图。一个工作流是由一系列首尾相连的节点构成的,每个节点都有输入和输出参数。如下图所示:
这个图是一个示意,并不表示任一工作流都有这些节点和路径。最简单的工作流,可以只有一个开始节点和一个结束节点。
关于“唯一输入”和“唯一输出”,多解释一下,指的是工作流有唯一的入口和唯一的出口(截止到2024.06),并不是指工作流只能有一个入参,且只能有一条输出消息。扣子工作流的入参可能不止一个,上面已经提到,工作流可以产生多次输出消息。
4.扣子工作流的组成模块
还是直接看图,创建工作流默认打开的页面如下:
除了开始节点和结束节点是每个工作流中固定且唯一的节点之外,左侧其它节点都是可以任意添加的。下面分别简述一下各个节点类型。
插件
很明显这个节点用来调用某个插件的,它的入参跟出参与插件接口相同。
大模型
这个节点是用于调用大模型来生成输出结果,跟创建Bot类似,可以在节点配置中选择不同的模型,并设置模型的提示词。
代码
用于执行一段代码(一个函数),目前支持python和javascript两种语言,节点的输入、输出与函数的入参、出参相同。
知识库
用于从知识库中检索信息,跟Bot编排页面的知识库类似。
工作流
该节点可以嵌套执行其它工作流。
图像流
该节点可以嵌套执行图像流,图像流的功能是从文本或图片根据指令生成新的图片。
选择器
这是一个if … else结构,可以根据条件的不同结果,执行不同的分支流程。
文本处理
用于字符串拼接或分割,当然也可以用代码节点来实现。
消息
用于输出一条消息回复给用户。
变量
用于读取或写入Bot变量,工作流本身是没有存储的,但是通过变量节点可以对使用它的Bot的变量进行读写操作。
数据库
用于读取或写入Bot的数据库,工作流本身是没有存储的,通过数据库节点可以对使用它的Bot的数据库进行读写操作。
5.扣子工作流的示例
我们根据上面的相关知识做一个简单的工作流应用,实现的功能是:根据用户输入的url,将对应网页的内容生成思维导图。
其中,1、3需要分别调用网页抓取和思维导图插件,2需要利用AI的内容总结能力。下面逐步完成这个工作流的创建。
第一步
先在“个人空间”(或团队空间)里面,切到“工作流”页签,点右上角的“创建工作流”,输入工流名称和描述(描述一定要写清楚,供大模型理解和调用),如下:
第二步
确认之后,进入工作流编排页面。根据上面的功能分解,该工作流需要添加两个插件节点,一个大模型节点。写这篇文章时,发现Coze的一个bug——在使用大模型总结长文本时,提示词过长导致后台报错。所以取消了大模型节点,直接使用扣子官方的LinkReaderPlugin插件,将网页抓取和内容总结合二为一,思维导图选择官方的generateTreeMind插件,将各节点相连,如下所示:
第三步
由于整个工作流执行时间可能比较长,可以在中间步骤增加消息节点,给用户及时的回复,避免用户等待时间过长而放弃,增加消息节点后工作流如下:
第四步
由于网页抓取可能会失败,在失败时(即error_code不为空)需要不同的处理方式(直接回复一条失败消息即可),所以还需要增加一个选择器节点,再加一个文本处理节点用于构造一条失败消息。最后在结束节点里面,将回答模式改为“使用设定的内容直接回复”,在“回答内容”下,将成功的内容“data”和失败的回复内容“errmsg”拼接(因为只会有一个分支执行,只有一个变量有值,所以拼接在两种情况都可以得到预期的结果)。如下所示:
第五步
这样一个工作流基本上就编排好了,然后右上角“试运行”,发现报错了,提示文本处理和消息节点的参数不能为空,因为这几个节点都是固定的消息内容,不需要使用参数,所以直接把参数删掉即可,再次“试运行”,输入url参数:https://www.coze.cn/docs/guides/workflow,运行,发现生成最终结果了:
第六步
试运行通过,点发布,就可以在Bot中使用了。
第七步
我们可以创建一个Bot(创建Bot的详细操作,可以参考《用扣子(Coze)搭建Bot智能体详解》),使用刚刚发布的工作流,如下:
以上就是创建并使用扣子工作流的步骤。
总结
工作流是搭建Bot智能体的一种很重要的技能,稍微复杂或比较实用的Bot基本上都使用了工作流。本文简单介绍扣子(Coze)工作流的基本概念,使用场景,结构和构成,并通过一个例子展示了扣子工作流的编排和使用,帮助小白用户快速掌握扣子工作流。当然,要熟练掌握一种技能,还是需要多动手操作,并学习模仿别人的成果,在扣子的工作流商店中,可以看到其它用户发布的各种工作流,点击可以查看到工作流的节点配置信息,对于新手是一个比较好学习模仿途径。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-14
coze+Ten Agen:构建实时语音对话
2024-12-06
学会这个Coze,动动嘴就把图P了!
2024-12-05
coze模版变现收费通道开启,你的智能体可以变现了!
2024-11-23
最新扣子(coze)实战应用工作流:自动记录日常行踪并储存到表格,还能进行"图表分析"的工作流,让你明白时间都去哪儿了
2024-11-19
使用Coze平台开发一个看图配诗的智能体
2024-11-13
扣子(coze)最新的 "提示词"仓库功能上新啦,让搭建门槛大大降低.[AI agent]
2024-10-22
coze平台保姆级教程,手把手教你创建属于你的AI Agent
2024-10-16
最新扣子(coze)实战案例 >拼图游乐馆< 荣获大赛【天马行空】奖,完全免费教程
2024-07-18
2024-07-18
2024-07-18
2024-05-09
2024-05-09
2024-07-07
2024-07-04
2024-06-08
2024-05-10
2024-07-31