AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


扣子(Coze)的工作流到底怎么用?
发布日期:2024-08-06 22:02:11 浏览次数: 3767 来源:智能体爱好者

工作流是搭建Bot智能体的一种很重要的技能,稍微复杂或比较实用的Bot基本上都使用了工作流。本文从工作流概念讲起,然后介绍扣子工作流的结构,最后以一个示例结尾,便于小白用户透彻掌握。

内容如下:

1.扣子工作流简介
2.扣子工作流能解决什么问题?
3.扣子工作流的逻辑结构
4.扣子工作流的组成模块
5.扣子工作流的示例
6.总结


1.扣子工作流简介

什么是工作流?

工作流(Workflow)是指一系列相互关联的步骤或任务,用于完成特定的业务过程或项目。它定义了任务的顺序、执行者以及相关的条件和规则,以确保流程的顺利进行和最终目标的达成。

工作流在日常工作中很常见,比如:财务报销要经过填写报销单、提交发票、财务审核、分管领导审核等步骤,就是典型的工作流;软件开发领域的CI/CD流水线也是一种工作流。

扣子的工作流与传统工作流类似,但也有不同之处。传统工作流既可以手动、也可以自动执行,或者二者结合。扣子的工作流是一种自动执行多个相关步骤的可复用流程,一个Bot可以使用多个工作流,Bot可以根据用户的行为选择并执行不同的工作流。

扣子工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。

说到这里,有一个很自然的疑问:既然Bot是基于大模型搭建的,为什么大模型不直接把相关的任务执行了,告诉我们结果就行?还要引入一个工作流?

原因也很简单,虽然现在的大模型比较智能,但是还没有那么智能!大模型(或者说生成式AI)是基于概率来生成内容,这就意味着它并不是每次都能给出符合要求的结果,特别是对返回结果要求比较精确的场景。

工作流是对当前大模型能力不足的一种补偿机制,在大模型智能化程度还不够高的时候,通过人为编排的工作流(注入人的智能),让智能体具有更高的可用性和可靠性,提升用户体验。

2.扣子工作流能解决什么问题?

既然我们已经对扣子的工作流有所了解了,那么工作流能解决什么问题?或者说在什么情况要使用工作流?根据自己的理解给出一些建议:

1.使用提示词无法达到预期效果

        在Coze平台搭建Bot智能体时,一般是先从编写提示词开始。有时候我们按照提示词工程技巧编写了清晰明确的结构化指令,经过反复迭代优化,仍然达不到预期效果,那么可以考虑采用工作流。比如长文本写作(调研报告),先是要收集相关资料,生成写作大纲、划分各个章节,再对各章节进一步收集资料、逐步生成章节内容, 最后是总结。仅仅通过提示词,大模型可能难以产生一篇结构合理、内容翔实的文章,这时候可以通过工作流来实现。

2.需要多次调用插件或外部工具的场景

        有些大模型具有Function call能力,可以调用外部工具。但如果需要调用多个外部工具,且他们具有严格依赖关系时,大模型可能不是每次都能很好地完成目标。比如根据一个url,获取网页内容、总结要点、生成思维导图的任务中,“网页内容抓取”、“生成思维导图”两个步骤都需要调用外部工具(插件),中间还需要大模型来总结要点,这个可以通过工作流来实现。

3.需要使用代码加工数据或生成响应

        大模型虽然能够产出还不错的内容,但是很难对数据进行精确处理,在这种情况下,可以使用工作流中的代码节点来解决。Coze官方文档中,介绍了一个使用工作流和代码节点生成随机数的例子。

4.需要根据某个条件执行不同的分支处理

        比如做一个答题Bot,根据用户选择的不同选项,来回复不同的内容。

5.需要在一次用户请求中多次输出消息

        大模型的工作方式是一问一答,即根据输入产生输出。在一些比较复杂的应用中,可能需要对一次用户的问题,回复多条消息;或者一次完整输出的耗时比较长,为了提高用户体验,需要分为多次输出。可以在工作流中使用消息节点来产生多次输出消息。

3.扣子工作流的逻辑结构

    简单来说,扣子工作流是一个有唯一输入和唯一输出的有向无环图。一个工作流是由一系列首尾相连的节点构成的,每个节点都有输入和输出参数。如下图所示:


这个图是一个示意,并不表示任一工作流都有这些节点和路径。最简单的工作流,可以只有一个开始节点和一个结束节点。

关于“唯一输入”和“唯一输出”,多解释一下,指的是工作流有唯一的入口和唯一的出口(截止到2024.06),并不是指工作流只能有一个入参,且只能有一条输出消息。扣子工作流的入参可能不止一个,上面已经提到,工作流可以产生多次输出消息。

4.扣子工作流的组成模块

还是直接看图,创建工作流默认打开的页面如下: 


除了开始节点结束节点是每个工作流中固定且唯一的节点之外,左侧其它节点都是可以任意添加的。下面分别简述一下各个节点类型。

插件

很明显这个节点用来调用某个插件的,它的入参跟出参与插件接口相同。

大模型

这个节点是用于调用大模型来生成输出结果,跟创建Bot类似,可以在节点配置中选择不同的模型,并设置模型的提示词。

代码

用于执行一段代码(一个函数),目前支持python和javascript两种语言,节点的输入、输出与函数的入参、出参相同。

知识库

用于从知识库中检索信息,跟Bot编排页面的知识库类似。

工作流

该节点可以嵌套执行其它工作流。

图像流

该节点可以嵌套执行图像流,图像流的功能是从文本或图片根据指令生成新的图片。

选择器

这是一个if … else结构,可以根据条件的不同结果,执行不同的分支流程。

文本处理

用于字符串拼接或分割,当然也可以用代码节点来实现。

消息

用于输出一条消息回复给用户。

变量

用于读取或写入Bot变量,工作流本身是没有存储的,但是通过变量节点可以对使用它的Bot的变量进行读写操作。

数据库

用于读取或写入Bot的数据库,工作流本身是没有存储的,通过数据库节点可以对使用它的Bot的数据库进行读写操作。

5.扣子工作流的示例

我们根据上面的相关知识做一个简单的工作流应用,实现的功能是:根据用户输入的url,将对应网页的内容生成思维导图。

先对这个功能进行分解如下:
    1.抓取url对应的网页内容
    2.总结内容要点
    3.将要点生成思维导图

其中,1、3需要分别调用网页抓取和思维导图插件,2需要利用AI的内容总结能力。下面逐步完成这个工作流的创建。

第一步

         先在“个人空间”(或团队空间)里面,切到“工作流”页签,点右上角的“创建工作流”,输入工流名称和描述(描述一定要写清楚,供大模型理解和调用),如下:


第二步

        确认之后,进入工作流编排页面。根据上面的功能分解,该工作流需要添加两个插件节点,一个大模型节点。写这篇文章时,发现Coze的一个bug——在使用大模型总结长文本时,提示词过长导致后台报错。所以取消了大模型节点,直接使用扣子官方的LinkReaderPlugin插件,将网页抓取和内容总结合二为一,思维导图选择官方的generateTreeMind插件,将各节点相连,如下所示:


第三步

        由于整个工作流执行时间可能比较长,可以在中间步骤增加消息节点,给用户及时的回复,避免用户等待时间过长而放弃,增加消息节点后工作流如下:


第四步

        由于网页抓取可能会失败,在失败时(即error_code不为空)需要不同的处理方式(直接回复一条失败消息即可),所以还需要增加一个选择器节点,再加一个文本处理节点用于构造一条失败消息。最后在结束节点里面,将回答模式改为“使用设定的内容直接回复”,在“回答内容”下,将成功的内容“data”和失败的回复内容“errmsg”拼接(因为只会有一个分支执行,只有一个变量有值,所以拼接在两种情况都可以得到预期的结果)。如下所示:


第五步

        这样一个工作流基本上就编排好了,然后右上角“试运行”,发现报错了,提示文本处理和消息节点的参数不能为空,因为这几个节点都是固定的消息内容,不需要使用参数,所以直接把参数删掉即可,再次“试运行”,输入url参数:https://www.coze.cn/docs/guides/workflow,运行,发现生成最终结果了:

第六步

        试运行通过,点发布,就可以在Bot中使用了。

第七步

        我们可以创建一个Bot(创建Bot的详细操作,可以参考《用扣子(Coze)搭建Bot智能体详解》),使用刚刚发布的工作流,如下:

以上就是创建并使用扣子工作流的步骤。

总结

工作流是搭建Bot智能体的一种很重要的技能,稍微复杂或比较实用的Bot基本上都使用了工作流。本文简单介绍扣子(Coze)工作流的基本概念,使用场景,结构和构成,并通过一个例子展示了扣子工作流的编排和使用,帮助小白用户快速掌握扣子工作流。当然,要熟练掌握一种技能,还是需要多动手操作,并学习模仿别人的成果,在扣子的工作流商店中,可以看到其它用户发布的各种工作流,点击可以查看到工作流的节点配置信息,对于新手是一个比较好学习模仿途径。 


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询