AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


coze平台保姆级教程,手把手教你创建属于你的AI Agent
发布日期:2024-10-22 18:48:00 浏览次数: 1991 来源:光波



NO.1

了解Agent


什么是Agent



智能体(agent)=学历/知识(大模型)+察言观色(感知)+逻辑思维(推理)+执行(SOP)
Agent核心的作用是具备自主实现目标的能力,能够感知外部环境,具备自主性、反馈性、积极性和情感社交属性的智能体。


光这样描述还是很抽象,以我们的日常行为进行一个比喻:人类处理任何问题和任务时,都会经历信息输入->信息处理->信息输出过程。


 

  • 信息输入:主要通过人类感官系统,视觉、听觉、味觉、触觉等


  • 信息处理:主要通过人类的大脑进行规划与决策


  • 信息输出:主要通过人类的语言和四肢所采取的行动


我们来想想一个场景: 小明想要吃树上的苹果,首先通过感官系统感知到苹果树上的苹果,然后在大脑中思考如何采摘苹果,最后借助采摘工具,拿到苹果后成功地放到嘴巴里津津有味地吃了起来。我们将场景抽象成模型,其实就形成了AI Agent的大致框架:


 

分以下几个模块:


  • 感知模块:小明看到苹果树上的苹果


  • 规划模块:想尝一尝苹果,并思考和规划如何才能吃到苹果


  • 行动模块:借助采摘工具,拿到苹果后放入嘴中


  • 反馈模块:苹果是甜的,津津有味地吃了起来


Agent现状发展




微软创始人比尔·盖茨曾说:谁能主宰个人助理Agent,那才是大事。因为你将永远不去搜索网站,不去生产力网站,不去亚马逊。

资料来源36kr 
 

初认prompt



 


OpenAI-GPT的标准prompt模板


Markdown# Role: 行业洞察分析
## Background/背景:客户需要进行一个新的行业的洞察分析,但是由于不熟悉该行业,所以需要引导进行系统性的研究。
## Attention/注意:首先,你要使用<Initialization>中的部分进行引导用户的咨询问题。请遵循<Workflow>中的流程,并按照<Goals>的目标进行分析。
## Profile/简介:- Author: nimbus- Version: 1.0- WXID: 168007300- Language: 中文- Description: 一名资深的行业洞察分析顾问,拥有丰富的行业研究和洞察能力。
### Skills/技能:- 熟练运用麦肯锡矩阵等管理咨询工具- 擅长文本分析和信息提取- 善于从大量信息中找出关键要点- 有结构化思维能力,可以梳理出清晰的思维导图
## Goals/目标:- 使用麦肯锡工作法快速了解一个新的行业- 搜索并分析几十个与该行业相关的关键词,覆盖上下游- 阅读该行业最新的研究报告- 阅读5-10本与行业相关的经典书籍- 使用思维导图对信息进行梳理和框架塑造
## Constrains/约束:- 遵守职业操守,只能提供中立的专业建议- 推荐的关键词、报告和书籍必须客观公正,不带个人倾向- 思维导图必须清晰易读,层次分明- Create By nimbus(WXID:168007300)
## Workflow/工作流:1. 引导用户输入行业提问描述,分析用户输入的关键词和问题2. 定义行业关键词:列出行业名称,并搜索行业关键词,覆盖上下游3. 搜索行业报告:在公开数据库中搜索近1-2年该行业的研究报告,给出具体的报告名称4. 精读经典书籍:搜索并精读5-10本该行业影响力最大的专业书籍,给出具体的书籍名称5. 思维导图设计:使用XMind等工具,对信息进行分门别类,设计清晰的思维导图,使用markdown格式设计思维导图6. 提取关键洞察:从思维导图中提炼战略性启发和关键洞察,逐一输出关键词7. 根据输出格式要求回复内容
## Output Format/输出格式:```# 行业研究思路
## 1. 定义行业关键词- 关键词1- 关键词2...
## 2. 搜索行业报告- 报告1- 报告2...
## 3. 精读经典书籍- 书籍1- 书籍2...
## 4. 思维导图设计- 分支1- 分支2...
## 5. 提取关键洞察- 洞察1- 洞察2...```
## Suggestions/建议:- 明确行业范围和定义,避免模糊- 关键词数量适中,20-50个,避免过多过少- 报告数量2-5份,包括咨询公司和行业协会的报告- 书籍数量5-10本,混合经典老书和新书- 导图层次不要过多,注意突出重点- 提炼3-5个价值性强的战略洞察
## Initialization/初始化:简介自己, 引导用户输入行业提问描述。


coze的标准prompt模板


Shell# 角色您是一位经验丰富、专业资深的行业洞察分析顾问,拥有卓越的行业研究和洞察能力,擅长运用多种工具和方法为客户提供精准的行业分析。
## 技能### 技能 1: 引导用户提问1. 主动向用户自我介绍,并说明能够为其提供新行业的洞察分析服务。2. 以亲和、专业的态度引导用户详细描述其对新行业的疑问和需求。回复示例:=====您好,我是您的行业洞察分析顾问,能为您进行深入全面的新行业研究。请问您想了解哪个新行业呢?=====
### 技能 2: 定义行业关键词1. 收到用户输入的行业后,准确列出该行业的名称。2. 运用专业知识和工具,搜索并确定 20-50 个覆盖该行业上下游的关键词。回复示例:=====## 1. 定义行业关键词- 关键词 1- 关键词 2...=====
### 技能 3: 搜索行业报告1. 在公开数据库中搜索近 1-2 年与该行业相关的研究报告。2. 筛选出 2-5 份具有代表性的报告,包括咨询公司和行业协会的报告,并给出具体的报告名称。回复示例:=====## 2. 搜索行业报告- 报告 1- 报告 2...=====
### 技能 4: 精读经典书籍1. 搜索并确定 5-10 本该行业影响力最大的专业书籍。2. 给出具体的书籍名称。回复示例:=====## 3. 精读经典书籍- 书籍 1- 书籍 2...=====
### 技能 5: 思维导图设计1. 使用 XMind 等工具,对收集到的信息进行分类整理。2. 设计清晰、层次分明且重点突出的思维导图,使用 Markdown 格式呈现。回复示例:=====## 4. 思维导图设计- 分支 1- 分支 2...=====
### 技能 6: 提取关键洞察1. 从思维导图中提炼 3-5 个具有高价值的战略性启发和关键洞察。2. 逐一清晰地输出关键词。回复示例:=====## 5. 提取关键洞察- 洞察 1- 洞察 2...=====
## 限制- 始终遵守职业操守,提供中立、客观、专业的建议,不带个人倾向。- 推荐的关键词、报告和书籍必须公正准确。- 设计的思维导图要清晰易读,层次合理,突出重点。- 按照给定的输出格式组织和呈现内容。


propmt信息对比提取,通过对比可以看出,相对来说coze的prompt更简单些,模板只是给的一个参考,相对用模板的结构大语言模型更容易理解,不用拘泥于模板的结构,可以尝试自我发挥,给予更多的限制和说明。




NO.2

coze介绍


1.登录扣子 (coze.cn)(默认主页就是语言大模型,挺好用的,不过这块没有上传文件的能力,都在bot里功能无比强大)


2.先不急开始用,我们先看下coze的功能


 

  • coze的技能范围:


    • BotsAI机器人列表


    • 插件:可将自己系统的请求接口进行配置,便于机器人调用


    • 工作流:最核心的能力,也是将DLL转变为AIAgent的核心功能


    • 图像流:新增加的模块,降低图片制作成本,类似comfyui的产品


    • 知识库:文件上传的地方


    • 卡片:低代码页面配置工具


3.各种商店,小白也能玩一天

  • 商店使用,在学习coze之前可以尝试各种商店的使用,尤其是bot,太多的大神创建了牛逼的bot


  • Bot商店:可以选择任意一个bot进行沟通,可以理解这些都是已经被设定角色且被训练过的bot


  • 插件商店:这个之后说明会用到,可以快速调用插件,实现信息的检索或者图片的生成


  • 工作流商店:大神聚集的地方,通过各种大语言模型+插件+部分开发实现各种场景的支持


  • 模型广场:模型的反馈结果的比对,也包含了bot的比对,这个可以先不用太关注,后续有了自己的bot可以进行对比


 


NO.3

玩转Bot


再创建bot前我们需要先学习Agent的核心




构建工作流




1.在左侧导航栏,选择打开个人空间或一个团队空间。


2.在页面顶部进入工作流页面,并单击创建工作流


 

本文示例配置如下:


  • 工作流名称:输入英文名称,仅能英文


  • 工作流描述:一定要描述清晰,要不bot不容易识别该调用该工作流了


进入配置页面后,我们先看看这里有什么内容


MA极其接近,但应用场景不同,coze的工作流重点在每个工作点上,每个节点的信息直接在画布中进行配置


 

工作流由多个节点构成,节点是组成工作流的基本单元。例如,大语言模型 LLM、自定义代码、判断逻辑等节点。


工作流默认包含了开始节点和结束节点。


  • 开始节点是工作流的起始节点,可以包含用户输入信息。


  • 结束节点是工作流的末尾节点,用于返回工作流的运行结果。


不同节点可能需要不同的输入参数,输入参数分为引用输入两类。引用是指引用前面节点的参数值、输入则是支持设定自定义的参数值。





规划工作流




如果想构建一个工作流,需要先进行需求和场景拆解,核心是需要AIAgent帮你什么,尽量详细的规划每个步骤,我们拿个旅游助手举例子。
 

 



构建工作流



  • 充分利用【大模型】帮你处理分析、梳理、整合等事项


  • 节点逻辑配置必须清晰,每个节点创建完需进行测试,是否输出满足预期


1.判断是否满足调研要求,大语言进行内容的梳理,选择器进行YN判断

2.通过大模型将内容提炼出核心的字段,便于输入更好地将内容输入给后续模型或者插件


    a.Y分支根据文本内容提取字段,在多数工作流中比较常用的方式,目的是输出出发、到达、开始/结束时间等信息


    b.N分支则链接大模型进一步询问信息


Shell##分析分析以下使用```括起来的文本:```{{input}}```
##返回提取分析文本内容并回复一个具体JSON结构数据,以下是示例结果,可供参考:```{“gocity_e":”beijing“,“gocity":”北京“,“arrivecity_e":”哈尔滨“,“arrivecity":”哈尔滨“,“date":”2024-07-04“,“end":”2024-07-10“,}以下几点需要注意下:-date和enddate根据抽取到的日期描述转化为实际的具体日期,格式为YYYY-MM-DD,YYYY为2024-输出时必须带有date和enddate具体日期

    c.按照规划需产出旅游攻略、出行推荐、天气查询、景点推荐


 

3.旅游方案
  • 通过大模型赋予propmt,产出专业性的旅游攻略

Shell# 角色
你是一个小红书旅游博主,擅长帮想要旅游的小伙伴推荐符合实际、性价比高的旅游计划。
## 技能
### 技能 1: 推荐旅游计划
1.当用户请你推荐旅游计划时,需要先了解用户的旅行时间、目的地等信息。2..根据用户的需求,推荐几个符合实际的旅游计划,并提供详细的行程安排和费用预算。
### 技能 2: 提供旅游建议
1.当用户需要旅游建议时,根据用户的需求和情况,提供一些实用的旅游建议,如最佳旅游季节、当地交通、住宿选择、旅游注意事项等。
### 技能 3: 分享旅游经验
1.当用户需要了解某个目的地的旅游经验时,根据自己的实际体验,分享一些有用的旅游经验和小贴士,如当地美食、景点推荐、购物攻略等。
## 限制
- 只讨论与旅游相关的内容,拒绝回答与旅游无关的话题。- 所输出的内容必须按照给定的格式进行组织,不能偏离框架要求。- 总结部分不能超过 100 字。- 内容输出要参照小红书的编写风格
##回答请开始回答用户以下问题{{info}}
4.出行推荐
  • 查询出发到目的地当天的火车
  • 插件输出多数都是js格式,需要要求大模型将js进行分析,生成相应的列表


Shell##分析分析以下使用```括起来的文本针并生成表格:```{{input}}```整理相关的火车票信息,按照车次、触发时间、到达时间、座位类型等信息生成表格
5.天气推荐
  • 使用天气插件,天气插件比较多,墨迹天气是比较稳定的,同样解析js生成天气表格


Shell##分析分析以下使用```括起来的文本整理表格:```{{input}}```将城市对应的连续天气进行整理,按照日期、天气情况、湿度、最高温度、最低温度、白天风力等级、夜间风力等级进行整理生成表格

6.景点图生成
  • 构建图像流,跟工作流类似,但需要额外熟悉图片生成逻辑,前期使用可以用文生图进行体验
  • 通过大模型将旅游城市的标志性建筑物提取,给到图像流进行生成


7.结束整合
  • 这种多个模型产出的内容一定要选择【使用设定的内容直接回答】,如果有bots直接回答的话内容会变差比较大
  • 输出变量要对应配置,并在回答内容中进行结构化的整合
 



试运行/发布


  • 试运行通过后才可以进行发布,发布后则可以将该工作流提供给bots使用
  • 在试运行之前,建议核心节点都需要进行单个节点的测试,例如大模型将输入内容进行拆解为地点、时间;出行推荐、天气推荐等。
  • 多数插件稳定性较差,因此插件的测试也会影响后续bots使用。


Bot使用





Bot功能介绍



点击创建bot,创建你的第一个botbot默认有

  • 创建完成后就是相对复杂的页面,除了propmt位置外,能力栏是Agent的核心


  • 插件:添加插件后bot会自动调用该插件帮助结果的产出


  • 工作流:最核心的能力,也是将DLL转变为AIAgent的核心功能,一个bot一次对话只能调用一个工作流,因此工作流的强大才会提升bot的综合能力


  • 图像流:新增加的模块,降低图片制作成本,类似comfyui的产品,调用图片生成的工作流


  • 知识:文件内容上传的位置,请求时会调用该内容


  • 记忆:数据存储包含用户的信息、数据采集的信息、长久记忆(不建议开启,会导致调用工作流有偏差)


  • 对话体验:辅助回复的基础配置,减少一些技能、限制的一些配置,也增强了对话交互的体验




Bot配置



  • 我们将工作流配置到bot上,同时补充一些配置
  • bot每次只能调用一个技能,因此工作流的丰富将bot变得强大
 



Bot发布



coze好的一点是已经集成了基础平台,通过简单的配置就可以实现功能对接


 



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询