AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI智能体:手把手带你用扣子搭建知识库,还能自动收集客户需求
发布日期:2024-08-25 09:19:12 浏览次数: 1647


学习提示词已有一年多,我个人的提示词小报童已有 1100 多位付费用户。

过去接了不少提示词的商单,可最近咨询的用户却越来越少。

提示词传播太快、可替代性高,这是一部分问题。流量不够,这也是个问题。

如今扣子的用户群体规模庞大,是否能搭建一个提示词教学的智能体,同时把定制化需求 自动收集到飞书表格 中呢?

你是否也和我一样,想过在分享知识的同时,也能收获更多商机呢?

接下来,我们来看看如何借助扣子完成这个目标的。

一、创建知识库

之前没有写过知识库的创建教程,这次会写稍微细一点。

一般搭建知识库问答助手时,我们需要提前准备知识库文件。

这些文件要么来自企业或个人本地,要么来自个人账号下的云文档平台,要么源自互联网。

所以我将从个人本地,以及小报童中的部分章节中挑选内容,作为知识库的源头。

个人空间 点击 知识库 > 创建知识库.

可以选择不同的知识类型,支持文本、表格、照片。本次我选择了文本格式。

导入内容可以支持本地文件,在线网页内容、Notion、飞书文档、还可以完全自定义内容。

本次我选择了本地过去积累的提示词基本文档,其中一部分来自我的小报童中。

支持文件格式也挺丰富的。支持格式:PDF、TXT、DOC、DOCX、MD。

分段的方式支持 自定义自动分段与清晰

自定义中,可以设定分段的标识符、分段长度,和一些预处理规则。

本次文件内容没有特殊需要处理的地方,直接选择了默认的自动分段与清洗。

数据处理完后点击 确认.

我们可以看到知识库的内容被切割成不同的段落.

二、搭建工作流

接下来,我们来搭建工作流。

建议各位小伙伴在搭建相对复杂的工作流时,可以提前画一画。

利用在线工具,比如 Process On、Mermaid ,或者在纸上梳理一下,这样搭建起来效率更高。

这是我搭建后的 Coze 工作流,接下来我来拆解下。

怎么识别用户输入的到底是提示词的问题,还是想要定制提示词,我这边利用了「意图识别」节点。

官方介绍文档:https://www.coze.cn/docs/guides/intent_recognition_node

有小伙伴可能会问,「意图识别」和之前用过的「选择器」的区别是什么?

简而言之,选择器完全遵从设置的规则,意图识别是基于大模型的语义理解来确定分支的流向。

一)提示词问答分支

接下来,先看提示词问答的分支。

在这个部分,首先需要选择「知识库」节点,将「开始」节点中用户每轮的输入作为知识库查询的问题。

再选择第一步,我们搭建的知识库:提示词基础知识。这里涉及到几个参数,官方解释地很到位,我这边就不重复造轮子了。

测试下搜索出来的效果如何。由于设置参数:最大召回数量为 3,所以这边得到了 3 个结果。

内容的确来自本地文件,然而内容太过冗长,杂质也不少。这样回复给用户,肯定是不行的。

那接下来,我们增加「大模型」节点,将知识库搜索的结果作为 参考文本,再基于用户的问题进行回答,这样才会得到一段准确的回答。

这个过程实际上就是 RAG 的核心。总结如下:先将源文件分段后进行向量化,再基于用户的提问匹配到最为接近的答案,最后交给大模型来优化回答。

提示词:

忘记你已有的知识,仅使用{{knowledge}}中的内容作为你的知识,回答用户的问题{{question}}: 思考流程:1. 判断问题{{question}}是否与{{knowledge}}标记中的内容有关。2. 如果有关,你按下面的要求回答。3. 如果无关,你直接拒绝回答本次问题。回答要求:- 保持答案与中描述的一致。- 使用 Markdown 语法优化回答格式。- 使用与问题{{question}}相同的语言回答。

最后将输出结果返回给「结束」节点。

二)提示词定制化分支

过去承接了不少提示词定制化商单,价格在 500 至 3000 元不等。

过去收集需求,通常借助飞书问卷这种方式。

当然,这次搭建了提示词入门学习的智能体,也期待能获得一些定制化提示词的商机。

之前我们学习过如何将飞书插件接入扣子的方法,这次正好学以致用。

AI智能体:3分钟搞定数据存储,扣子+飞书让你效率翻倍

那我们提前需要准备一个简单的飞书多维表格。

那收集这些需求和联系方式,在扣子的工作流该怎么做呢?

这次我们将接触一个新节点 -- 「问答」。主要是帮助我们在工作流中收集用户需求、用户信息,用来获取用户意图。

官方文档:https://www.coze.cn/docs/guides/question_node

问答节点,提供两种收集信息的方式,第一种:直接回答,适合内容不确定,发散的情况。

第二种,选项回答,适合固定的回答方式。

在这个工作流中,我主要需收集 受众、痛点、预期效果微信号。问题较多,我将其分成了 2 次收集。

记得勾选:从回复中提取字段。并且设置需要从回答中提取的关键字段。

这里的原理很简单:借助大模型的语义理解能力,提取用户回答内容中的关键信息。

那么信息收到之后,接下来我们该怎么样传入飞书的多维表格呢?

记得之前教学飞书插件时,示例的数据格式是这样的:

「问答」节点的输出结果肯定不满足这样的格式。

没办法,再转换一次。我们可以利用「代码」节点来转换。

「代码」节点后续再单独解释,这次直接提供参考代码,大家可以参考着改。

记得关注我~ 未来将继续分享智能体相关知识和案例。

async def main(args: Args) -> list:params = args.paramsret = []record = {"微信号":params["wechat"],"受众人群":params["users"],"痛点":params["problem"],"预期效果":params["result"]}fields = {"fields": record}ret.append(fields)return ret

格式搞定后,接下来引入插件 -- 飞书多维表格 / add_records

将插件的关键信息配置好:

  • app_token 是多维表格的 url 链接

  • records 来自代码节点转换后的结果

最后传入「 结束」节点。测试下工作流,没问题后记得点击 发布

三、搭建 Bot

配置人设与回复,并选择之前创建的工作流。

测试一下效果。

测试定制化提示词的场景。

成功传入飞书。

这次仅仅是为了展示搭建思路,该智能体仍有很大的优化空间 。

四、总结

本次我用扣子搭建了一套提示词基础入门的智能体。

利用智能体把需求收集到飞书表格,构建了一整套自动化需求收集流程。

如果我们有一套细分领域的专家智能体,通过这种近乎零成本的方式,就能为我们带来可观的商机。

希望这篇教程能给大家带来帮助。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询