Coze工作流的深度体验:打造家庭会议助手并浅谈插件生态
发布日期:2024-06-02 18:48:05
浏览次数: 1995
来源:凡哥杂谈
前段时间在子女教育上遇到了一些困惑(辅导过娃的作业都懂),开始反思自己的教育方式是不是过于简单粗暴,寻求一些外部资源来改善这种状态。
学习的过程中了解到「家庭会议」是一个比较好的沟通方式,开始尝试通过每周一次的「家庭会议」来加强与孩子们的交流,关心他们的关切,增进彼此的了解。在尝试了 2 次之后,发现讨论的问题过于发散,再加上孩子们会提出一些对名词概念的困惑(例如:混淆正常的竞争与炫耀),因此准备增加这类主题,通过开放讨论、具体案例来帮助孩子们厘清不同概念的区别。考虑到这个事情是每周需要做的,何不做成一个工作流,弄成一个 Agent 智能体,针对具体的讨论主题,生成对应的大纲、内容,并最终创建一份能在家庭会议投屏分享的讲稿和 PPT?设计思路
在开发 Agent 工作流之前,先要明确几个问题:回到家庭会议助手这个案例,对应的输入就是:家庭会议主题。处理步骤是相对清晰的,但是需要在实现过程中做逐步的微调。最开始是打算直接生成 PPT,但是没有找到一个可用的插件,只好退一步生成 doc 文档。实现的过程,考虑到工作流处理时间比较长,基本上需要 1 分钟以上,为了让用户能够耐心地等待最后的结果,当触发到工作流时,会给到一个提示。工作流的实现细节本文不再赘述,感兴趣的小伙伴可以留言加 v 交流探讨。下面重点说下在搭建 Coze Agent 工作流的体验感受和思考。3.1 调试与日志
工作流的调试还是挺方便的,既支持整条流程的调试,也支持单个组件的调试,还支持查看调试日志,更意外的新版本新增了测试集管理(大概率是吸收了 iPaaS 产品的设计经验,哈哈哈)。这些调试工具虽然有一些偶发的 bug,但能够大幅提升工作流的调试效率。放几张单步调试和调试日志查看的界面让大家感受一下。美中不足的一点在于,当通过聊天 bot 触发工作流时,无法查询这部分的日志,导致这里的 debug 只能全靠直觉,花费了较多的时间。例如下面的报错就让人很崩溃,没有工作流日志,完全不知道从何查起。3.2 代码 IDE
目前 Coze 工作流缺少一些内置的函数处理组件,当我需要对两个数组进行拼接的时候,就只能上代码了。偶然发现新版本的代码组件已经支持了 AI 写代码的能力,顺手尝试了一把。AI 写代码似乎还差点意思,主要原因可能是提示语还不够想尽清晰(话是这么说,但如果足够智能的话,可以结合上一步调试的日志或者关联组件输出的格式,判断出入参数的格式,这才是更高级的 Copilot)。给出更明确的提示,效果好了一些,但仍然没有达到预期。
调试过程中还是会遇到一些异常输入导致脚本运行失败的情况。不想在这里过多纠缠,凭借自己残存的研发技能,结合混元助手的帮助,手搓了一段代码来适配各种异常情况的输入。3.3 插件体系
对于字节 Coze、腾讯元器这类 Agent 产品来说,插件将是未来平台的胜负手。倒不是说大模型不重要,而是大模型很难做出差异化,不管是用户层的感知还是底层的预训练和推理成本,都将会趋同并不会产生代差。不管是 bot 直接调用插件,还是工作流中使用到的处理节点,这里对 bot 产品化、工程化过程中开发提效是显而易见的。举个例子,2 个月前我打算手搓一个 AI 广播站的 bot,每天从指定的公众号中爬取新的推文,整理好发送一个 AI 日报消息。逻辑非常简单:爬取链接,生成正文摘要,大模型总结。但在爬取指定公众号新文章时就遇到了非常多的问题,通过 RPA 解决了抓取问题,又遇到了 cookie 过去问题,一路跌跌撞撞,耗费了好几天时间。如果平台能够提供一个获取指定公众号文章的插件,搭建这个 bot 就是几分钟的事情。当你做一件事情的时间成本能够数量级下降的时候,创新成功的概率也将得到极大的提升。量变产生质变。回到家庭会议这个场景,早期我花费一些时间去找、去试生成 PPT 的插件。虽然没有找到一件趁手可用的 PPT 插件,但 AiPPT 这款插件带给了我一些思考和启发。首先是搜索入口,AiPPT 排序很靠前,而且被引用的次数还比较多。进入到插件详情页,对插件的介绍和描述信息偏少,这里甚至可以提供一个 AiPPT 官网的跳转入口,一方面用户体验过更加顺滑,另一方面对插件开发者做导流,提升开发者的参与度,让插件生态更加繁荣。虽然 AiPPT 是一款独立的 SaaS 产品,但插件的维护还是 Coze 官方团队在维护,平台初期用户还没有积累到一个数量级,开发者还没有看到变现渠道,平台研发团队不得不自己下场来堆插件,先让飞轮转起来。但平台插件千千万,靠一己之力其实很难保证所有插件的体验,甚至对高频插件的打磨都会显得力不从心。通过发布日志可以看到,距离 AiPPT 上次更新已经两月有余,上插件容易,维护插件才是一项体力活。如何更好地构建活跃繁荣的开发者社区,不管是通过技术让插件开发更高效,还是采用强运营和商业化激励的手段,这里才是未来插件市场成败的关键。在使用 Coze 大模型插件以及 AiPPT 插件的时候,并不需要额外的授权,这里看似用户体验很顺滑,但实际上存在几个明显的隐患:1. 巨大的成本投入。例如在 Coze 调用月之暗面是不需要额外付费的,只能说字节财大气粗,不计成本先做用户增长;2. 体验的降级。共享接口配额是没有 SLA 保障的,因此在测试过程中,经常会遇到 LLM 调用超时的情况;3. 开发者动力不足。就拿 AiPPT 插件来说,如果能够做一个 AiPPT 注册授权机制,就能为 AiPPT 带来一个新增客户,那未来 AiPPT 团队是不是会更有意愿主动去维护 Coze 平台上的插件呢?无法提供一键授权机制,意味着通过 Coze 插件更适合获取一些公域上不需要鉴权的信息(诸如搜索、查天气、查股票等),很难切入到工作场景中,适用场景受到了大大的限制。每次体验 Coze 工作流的时候,当年做轻联(hiflow / iPaaS)的一幕幕不断地在脑袋中重放。Coze 工作流的演进过程也是如出一辙。所见略同的依次经历了如下几个阶段:做平台最大的想象是生态,最难做的也是生态。过程中最大的考验来自于,如何在有限的时间和资源投入的约束条件下,找到这个 Killer 插件,找到高频场景,实现强联结,完成商业化闭环。不管是抱大腿拿到人无我有的接口或入口,还是通过大量用户压测和现网数据来找到可商业化的落地场景,都离不开这个终极目标。考虑到上一波国内 iPaaS 团队一直在盈利的边缘挣扎,强如 OpenAI 也不得不放弃插件市场。在 AI Agent 浪潮的加持下,iPaaS 能否趁势而起,亦或是为 Agent 平台提供产品护城河,让我们拭目以待~
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业