AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


智能新伙伴:探索Coze智能体,用coze手搓一个项目小助理
发布日期:2025-01-16 08:25:44 浏览次数: 1533 来源:AI加所有

为了感谢大家的关注,给大家申请了一些红包封面,大家可以点击领取,领完为止。


在数字化转型的大潮中,人工智能技术的发展正以前所未有的速度改变着我们的工作方式、生活方式乃至思维方式。今天,就让我们一起来认识一位特别的新朋友——Coze智能体,并了解它是如何被创造出来的吧!

一、什么是Agent(智能体)?

首先,在深入探讨Coze之前,我们需要先了解一下“Agent”这个概念。简单来说,Agent是一种能够自主完成特定任务或目标的人工智能程序。也可以解读为agent能够通过感知环境、规划决策和执行行动来实现特定目标的程序它们可以根据环境变化做出反应,执行预设的功能,比如信息查询、自动化处理等。随着技术的进步,Agents已经从最初的简单脚本发展成为能够进行复杂决策支持的强大工具。

OpenAI的应用研究主管Lilian Weng 23年6月撰写了一篇博客(https://lilianweng.github.io/posts/2023-06-23-agent/),提出AI Agent可能会成为新时代的开端。她提出了AI Agent的基础架构,即Agent=LLM(大型语言模型)+ 规划技能 + 记忆 + 工具使用。在Lilian Weng的这篇博客中,她将Agents定义为LLM、记忆(Memory)、任务规划(Planning Skills)以及工具使用(Tool Use)的集合,其中LLM是核心大脑,Memory、Planning Skills以及Tool Use等则是关键组件。

    

图片摘自:Lilian Weng 博客文章配图

工具模块(Tools):本模块负责对工具进行定义,包括工具的描述、参数及其功能特性。这一模块确保智能体能够理解和有效使用可用的工具。

记忆模块(Memory):分为长期记忆和短期记忆。长期记忆用于存储持久的信息和经验,而短期记忆则用于临时存储当前任务相关的信息,从而支持智能体的实时决策。

计划能力(Planning):这部分负责规划如何完成特定任务,依赖于智能体的决策能力,以制定有效的行动步骤和策略,确保任务的顺利执行。

行动能力(Action):这一能力与工具模块密切相关。当智能体选择合适的工具时,它会通过容器执行该工具的相关操作。行动能力确保智能

简单来说,单纯的大模型,只能接收文字信息,并且有时大模型生成的内容是不真实的,即所说的“幻觉”,或者说一本正经的瞎编。而agent可以通过借助外部的工具,比如图片理解工具,url解析工具,RAG,联网搜索等等来解决。

OpenAI提到的AGI五个等级:

等级

描述

当前状态

L1

聊天机器人

已实现,例如GPT-3/GPT-4

L2

推理者

接近实现,能够解决博士水平的基本问题

L3

智能体

能够理解复杂指令,并在多任务环境中自主决策和灵活应对

L4

创新者

能够协助发明创造,独立提出新概念、假设和解决方案

L5

组织者

可以完成组织工作,执行整个人类组织的任务

二、遇见Coze

Coze简介    

扣子是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 AI 应用,并将 AI 应用发布到各个社交平台、通讯软件,也可以通过 API 或 SDK 将 AI 应用集成到你的业务系统中。 

扣子能做什么? 

借助扣子提供的可视化设计与编排工具,你可以通过零代码或低代码的方式,快速搭建出基于大模型的各类 AI 项目,满足个性化需求、实现商业价值。 

智能体智能体是基于对话的 AI 项目,它通过对话方式接收用户的输入,由大模型自动调用插件或工作流等方式执行用户指定的业务流程,并生成最终的回复。智能客服、虚拟女友、个人助理、英语外教都是智能体的典型应用场景。 

应用应用是指利用大模型技术开发的应用程序。扣子中搭建的 AI 应用具备完整业务逻辑和可视化用户界面,是一个独立的 AI 项目。通过扣子开发的 AI 应用有明确的输入和输出,可以根据既定的业务逻辑和流程完成一系列简单或复杂的任务,例如 AI 搜索、翻译工具、饮食记录等。

特点与优势

灵活的工作流设计

  • 扣子的工作流功能适合处理逻辑复杂且需要高稳定性的任务。

  • 提供多种可组合的节点,如大语言模型(LLM)、自定义代码、判断逻辑等。

  • 支持拖拉拽操作,无需编程基础即可快速搭建工作流。

无限拓展的能力集

  • 集成了丰富的插件工具,扩展智能体的能力。    

  • 官方提供多款插件,用户也可以创建自定义插件并发布到商店供他人使用。

丰富的数据源

  • 提供知识库功能,管理和存储数据,支持智能体与用户数据交互。

  • 支持上传本地文件或网站实时信息,使智能体能够利用这些数据回答问题。

持久化的记忆能力

  • 提供数据库记忆功能,智能体可以持久记住用户对话的重要参数或内容。

  • 例如,创建数据库记录阅读笔记,智能体通过查询数据库提供更准确的答案。

三、如何打造自己的Coze?

明确需求

我是做项目管理的,手里有多个项目,日常会有各种会议,还会有客户问题咨询,所以我期望做一个agent,能够记录我的会议信息,对于日常群里处理的问题和解决办法,能够存入飞书表格中,同时飞书表格又作为agent知识库的输入,如果遇到同类问题,可以发给agent,通过知识库检索处解决办法。大概流程如下:

技术选型说明:选择的coze智能体,日历通过调用飞书日历进行日程的增删改查,日常问题和知识库都是通过飞书表格,这样能够形成技术闭环。我的理想想法是通过微信实现,把智能体接入个人微信,可以把日程客户聊天记录发给微信,接收后能支持图片理解、内容理解,区分是日程、问题还是faq记录。但是当前整体的技术闭环还达不到,github上的Cow(chatgpt-on-wechat项目)可以实现,不过近期有封号的风险且需要租用设备,相对复杂些。就暂时用当前方案。也许后续新技术出现会解决这些问题。    

创建一个智能体

智能体是单agent模式,主要涉及使用的包括插件(调用飞书日历)、工作流、知识库(表格)、变量。智能体的提示词是:

Plain Text                  
# 角色                  
你是一位专业高效的项目小助理,负责精准处理项目经理安排的工作。能将收到的信息迅速转换为问题和答案的形式,并规范地存储到表格中。同时,还能妥善处理与项目相关的日程安排。                  
                    
## 技能                  
### 技能 1: 信息转换                  
1. 当接收到项目经理发送的信息后,认真仔细地分析其内容,精准提取关键问题以及对应的答案。                  
2. 判断文字内容是FAQ的问题和答案组合,则发给pm_work处理。                  
                    
### 技能 2: 日程处理                  
1. 用户输入内容包含日程,则分析用户的实际需求,分别调用对应的插件create_event..等处理。                  
2. 如果用户只给了开始时间,则默认开始时间1小时后是结束时间。                  
                    
### 技能3: 日常问题解答                  
1. 用户输入一个问题,没有答案的情况下,调用产品知识库检索,如果检索不到,直接回复:“无此问题记录和解决办法,请联系相关同事支持。”
        

插件

插件使用的官方提供的飞书日历插件,增删改查都满足,只不过删除和更新时候,要先获取日程id,然后指定id操作。插件提示词是技能2部分,指导大模型分析用户输入的内容,如果包含日程就调用插件,同时如果只输入了开始时间则默认开始时间后一小时是结束时间。之所以必须有开始和结束时间,因为官方插件必须要传这两个参数。如下:    

使用官方插件有个坏处,不支持发布到豆包中,后续我再看是否能通过代码实现,豆包中的用户还是很多的。

工作流

我这里用到了两个工作流,分别是pm_work,负责处理FAQ记录,feishu_url工作流,负责初始化变量飞书表格的url,这个用处后面会说。

feishu_url工作流比较简单,只包含三部分,开始节点、变量和结束节点。如下:    

配置分别如下:

    

pm_work工作流总流程如下:

每个节点配置如下:

开始节点的输入是系统自动带入的,不需要调整。    

变量节点要注意,这里的值是选择获取的,要记忆--配置中的变量名称相同。    

大模型节点要注意:提示词里要求了返回结果是数组对象字符串格式,这里这样做的主要目的是为了下一个节点写入知识库。输出的格式就是Array            。      

大模型系统提示词:

Bash                     
# 角色                     
高效项目助理                     
                       
## 技能                     
### 技能 1:数据处理                     
1. 仔细理解用户输入内容,精准提取问题与对应的答案,确保包含完整的问题和答案,尽量不要改动用户输入的内容。                     
2. 将结果以数组对象字符串形式返回,格式为:[["问题","答案"]]                     
3. 提取的问题与对应的答案,外面必须严格使用双引号,绝对不能使用单引号,示例: <"问题","答案">。                     
4. 输出结果的数组长度应与实际的问题数量一致。                     
                       
## 限制                     
- 仅对用户内容进行格式化处理,不得添加无关信息。                     
- 严格按照规定的数组对象字符串格式返回结果,确保只使用双引号。
        

这里引入了文本处理节点,主要作用是格式化输出,将大模型输出的结果转化为数组格式,string1[0].question和answer分别获取的问题和答案字段。    

添加飞书表格节点,length是大模型输出的,一个问题算一条,是表格的输入,代表的行数,spreadsheet_token这里引入变量,即飞书表格的url就可以。

最后结束节点,返回文本,Group1可以获取add_rows的输出,但是太简单了,我获取的是文本转化节点的输出,这样能直观一些。

知识库    

知识库是通过飞书表格的形式设计的,飞书表格的好处是,官方标配,同时支持每日更新,方便维护。

    

可以关联你飞书账号的文档,然后设置每1天更新,这样的好处就是,随着问题的添加,知识库每天能自动更新了。这块步骤过多的啰嗦了,直接下一步下一步,注意表格是两列,问题一列,答案一列,可以选择问题列作为索引。然后在智能体的提示词里这样写:

变量配置

    

飞书表格url获取,可以自行了解飞书使用方法,智能体也提供了简单教程:

添加快捷指令

快捷指令是使用FAQ时候,可以点击添加飞书表格url按钮,在弹框中输入飞书url。这样就可以长期存储,不需要每次都输入了。

好的,到这里就可以调试,没问题可以发布了,发布页如下:    

红框里就是因为用了飞书表格和日历,没法直接在豆包平台发布。当然也支持微信、抖音等平台。

结束

这样我们就完成整个流程以及智能体的配置了。体验地址:https://www.coze.cn/s/iyoAL1gm/。也可以到coze商店搜索“项目助理”   。 

             

 

    

其他文章:

通义万象升级文生视频,加入了中文支持

初次尝试使用cursor做一个chrome插件

Kimi视觉思考版还可以这样玩?

豆包:大模型领域的领航者





53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询