我要投稿

AI智能体：手把手带你用扣子搭建知识库，还能自动收集客户需求

发布日期：2024-08-25 09:19:12 浏览次数： 2887 来源：熊猫Jay字节之旅

学习提示词已有一年多，我个人的提示词小报童已有 1100 多位付费用户。

过去接了不少提示词的商单，可最近咨询的用户却越来越少。

提示词传播太快、可替代性高，这是一部分问题。流量不够，这也是个问题。

如今扣子的用户群体规模庞大，是否能搭建一个提示词教学的智能体，同时把定制化需求 自动收集到飞书表格 中呢？

你是否也和我一样，想过在分享知识的同时，也能收获更多商机呢？

接下来，我们来看看如何借助扣子完成这个目标的。

一、创建知识库

之前没有写过知识库的创建教程，这次会写稍微细一点。

一般搭建知识库问答助手时，我们需要提前准备知识库文件。

这些文件要么来自企业或个人本地，要么来自个人账号下的云文档平台，要么源自互联网。

所以我将从个人本地，以及小报童中的部分章节中挑选内容，作为知识库的源头。

在 个人空间 点击 知识库 > 创建知识库.

可以选择不同的知识类型,支持文本、表格、照片。本次我选择了文本格式。

导入内容可以支持本地文件，在线网页内容、Notion、飞书文档、还可以完全自定义内容。

本次我选择了本地过去积累的提示词基本文档，其中一部分来自我的小报童中。

支持文件格式也挺丰富的。支持格式：PDF、TXT、DOC、DOCX、MD。

分段的方式支持 自定义 和 自动分段与清晰。

自定义中，可以设定分段的标识符、分段长度，和一些预处理规则。

本次文件内容没有特殊需要处理的地方，直接选择了默认的自动分段与清洗。

数据处理完后点击确认.

我们可以看到知识库的内容被切割成不同的段落.

二、搭建工作流

接下来，我们来搭建工作流。

建议各位小伙伴在搭建相对复杂的工作流时，可以提前画一画。

利用在线工具，比如 Process On、Mermaid ，或者在纸上梳理一下，这样搭建起来效率更高。

这是我搭建后的 Coze 工作流，接下来我来拆解下。

怎么识别用户输入的到底是提示词的问题，还是想要定制提示词，我这边利用了「意图识别」节点。

官方介绍文档：https://www.coze.cn/docs/guides/intent_recognition_node

有小伙伴可能会问，「意图识别」和之前用过的「选择器」的区别是什么？

简而言之，选择器完全遵从设置的规则，意图识别是基于大模型的语义理解来确定分支的流向。

一）提示词问答分支

接下来，先看提示词问答的分支。

在这个部分，首先需要选择「知识库」节点，将「开始」节点中用户每轮的输入作为知识库查询的问题。

再选择第一步，我们搭建的知识库：提示词基础知识。这里涉及到几个参数，官方解释地很到位，我这边就不重复造轮子了。

测试下搜索出来的效果如何。由于设置参数：最大召回数量为 3，所以这边得到了 3 个结果。

内容的确来自本地文件，然而内容太过冗长，杂质也不少。这样回复给用户，肯定是不行的。

那接下来，我们增加「大模型」节点，将知识库搜索的结果作为 参考文本，再基于用户的问题进行回答，这样才会得到一段准确的回答。

这个过程实际上就是 RAG 的核心。总结如下：先将源文件分段后进行向量化，再基于用户的提问匹配到最为接近的答案，最后交给大模型来优化回答。

提示词：

忘记你已有的知识，仅使用{{knowledge}}中的内容作为你的知识,回答用户的问题{{question}}: 思考流程：1. 判断问题{{question}}是否与{{knowledge}}标记中的内容有关。2. 如果有关，你按下面的要求回答。3. 如果无关，你直接拒绝回答本次问题。回答要求：- 保持答案与中描述的一致。- 使用 Markdown 语法优化回答格式。- 使用与问题{{question}}相同的语言回答。

最后将输出结果返回给「结束」节点。

二）提示词定制化分支

过去承接了不少提示词定制化商单，价格在 500 至 3000 元不等。

过去收集需求，通常借助飞书问卷这种方式。

当然，这次搭建了提示词入门学习的智能体，也期待能获得一些定制化提示词的商机。

之前我们学习过如何将飞书插件接入扣子的方法，这次正好学以致用。

AI智能体：3分钟搞定数据存储，扣子+飞书让你效率翻倍

那我们提前需要准备一个简单的飞书多维表格。

那收集这些需求和联系方式，在扣子的工作流该怎么做呢？

这次我们将接触一个新节点 -- 「问答」。主要是帮助我们在工作流中收集用户需求、用户信息，用来获取用户意图。

官方文档：https://www.coze.cn/docs/guides/question_node

问答节点，提供两种收集信息的方式，第一种：直接回答，适合内容不确定，发散的情况。

第二种，选项回答，适合固定的回答方式。

在这个工作流中，我主要需收集 受众、痛点、预期效果 和 微信号。问题较多，我将其分成了 2 次收集。

记得勾选：从回复中提取字段。并且设置需要从回答中提取的关键字段。

这里的原理很简单：借助大模型的语义理解能力，提取用户回答内容中的关键信息。

那么信息收到之后，接下来我们该怎么样传入飞书的多维表格呢？

记得之前教学飞书插件时，示例的数据格式是这样的：

「问答」节点的输出结果肯定不满足这样的格式。

没办法，再转换一次。我们可以利用「代码」节点来转换。

「代码」节点后续再单独解释，这次直接提供参考代码，大家可以参考着改。

记得关注我~ 未来将继续分享智能体相关知识和案例。

async def main(args: Args) -> list:params = args.paramsret = []record = {"微信号":params["wechat"],"受众人群":params["users"],"痛点":params["problem"],"预期效果":params["result"]}fields = {"fields": record}ret.append(fields)return ret