我要投稿

如何给公众号接入Coze（扣子）AI助理

发布日期：2024-08-18 21:03:55 浏览次数： 2060 来源：鹤啸九天

引言

给公众号接入免费AI助理，让大模型给你打工

（1）大模型与智能交互

往期文章《智能交互复兴：ChatGPT +终端（奔驰/Siri）= ？》里提到大模型对现有行业的冲击，现有NLP中低层应用、复合场景将被直接“重塑”，比如红极一时的智能对话。

《大模型时代，对话系统何去何从？》解释了让人又爱又恨的对话系统。

对话系统“爱”、“恨”交织：
爱：终极交互形态让人着迷，CUI，甚至更高级的多模态交互、脑机交互
恨：技术现实与期望鸿沟太大，智障频频。
鹤啸九天，公众号：鹤啸九天ChatGPT：从入门到入行（放弃）

曾有人断言：

只要对话系统核心技术还是意图识别+槽填充方案，就别指望有什么突破，相应的对话产品也都半斤八两。

短短几年时间，新技术来了，在大语言模型的加持下，对话系统如虎添翼。

原有pipeline架构被冲击得七零八落，高达80%的功能被简单prompt engineering（提示工程）所替代，如：知识挖掘（去重/摘要/脱敏/增强等）、NLU（意图识别+槽位抽取）、NLG（语言生成/风格化）。

GPT-4o出来后，相对独立的ASR和TTS也开始融合进来，这种强大的多模态交互能力让人眼睛一亮。

只剩下DM尚未被完全替代。

当前基于LLM的Bot开发平台用plugin+workflow方式，复现复杂交互逻辑，本质上还是沿用上一代的FSM技术（有限状态机）。

Agent模式则走得更远，无需配置交互逻辑，统一由PE设置，只是受限于LLM的黑盒不可控性，不适合需要精确控制的业务场景，如金融支付/业务流程依赖复杂的情形，容错率低。

（2）智能对话先驱

2023年上半年，大模型开始“入侵”：

车机交互：奔驰引入GPT
文档问答：各类Doc-Chat产品雨后春笋
个人助理：smartsifi/小艺/小爱，各大手机厂商纷纷把端侧LLM作为亮点打包发布。
垂类问答：支付宝发布“支小宝”，辅助做理财咨询。

详见：《智能交互复兴：ChatGPT +终端（奔驰/Siri）= ？》

2023年5月底，《如何搭建自己的ChatGPT智能问答——ChatBase介绍》里介绍了国外的知识问答系统ChatBase，借助GPT强大的语义理解能力，突破了上一代文档问答（Document QA）的瓶颈，只需上传一段文本、文件，甚至网站URL，就能低代码快速搭建一款知识问答机器人。

ChatBase虽然面向开发者，但GPT接入受限，需要付费。

2023年9月8日，蚂蚁发布了基于金融大模型能力的“支小宝2.0”与“支小助”。

to C产品“支小宝2.0”内测近半年，为用户提供高质量的行情分析、持仓诊断、资产配置和投教陪伴等专业服务，将在完成相关备案工作后上线。
to B产品“支小助”与蚂蚁平台合作机构内测共建，为理财顾问、保险代理、投研、金融营销、保险理赔等金融从业专家打造全链条的AI业务助手。

这些产品大多面向C端，只可体验，不可亵玩焉。

对于个人开发者，有没有一款免费、好用的问答助理呢？

公众号粉丝多了，难以逐个回复，解决办法：

①公众号后台配置关键词、自定义菜单，回答热门问题——人工处理，覆盖面有限，更新滞后，交互体验不太好。
②单独部署问答服务，通过api接入公众号后台——额外部署问答服务，api操作有学习成本，体验一般。
③用LLM充当问答引擎，api接入后台——国内不便接入ChatGPT，只能是国产LLM，价格已经被豆包打下来了，但这个方案依然要部署服务

2024年5月，一个豆包引发的价格战：

5月15日，字节发布豆包，价格低于同行99%
5月21日，阿里通义千问：直降97%
百度文心一言：ERNIE Speed、ERNIE Lite全面免费，即刻生效！
科大讯飞：轻量级免费，主力模型降价

这场价格战后，创业公司冰火两重天：基座模型的小公司前途渺茫，面向LLM应用的公司拍手叫好。

对于公众号博主，好事儿，不用担心调用成本了。

（3）Coze（扣子）

今年2月的文章《如何用字节Coze复现《决战拜年之巅》？》介绍了如何使用扣子快速构建一款聊天机器人，发布到豆包/Cici等平台上。

用户只需设计角色信息、对话逻辑、语言风格，以文本形式植入system prompt，就可以实现一个拜年游戏。

也可以使用多智能体（Multi-Agent）实现更加复杂的交互逻辑。

大致步骤：

①注册Coze（国内是扣子）
②创建Bot：名称、描述
③设置Bot：系统提示语、开场白、推荐语、插件、工作流（workflow）、知识库等
④调试、发布

具体操作步骤略，详见原文。

好在Coze（扣子）支持发布Bot到公众号平台，这样连api服务部署的成本也没有了！

（4）AI助理

那么，怎么快速构建自己的智能助理？

要求：

①低成本：无需部署服务、调用外部API，当然还有免费，不花钱
②便利：快速构建，无需太多学习成本
③功能多：支持常规咨询、文章查询，最好还能用ChatGPT同等功能

常见方式：单独搭建api服务，对接公众号的消息处理接口，其中api可以在特殊环境下直连OpenAI。

这种方式成本不低：服务器、api服务、OpenAI账户及费用。

（4.1）AI助理效果

借助Coze（扣子），以上需求都能实现。

直接展示效果：

进入公众号聊天窗口，提问即可体验效果

打招呼后，AI助理会以我的名义自我介绍。这个回答略啰嗦，跟真人交互有些距离。

改进：更新system prompt，植入我的画像信息，让AI助理的回答更加精简、准确。

这下就可以回答个性化问题，简洁明了，不啰嗦（符合我的个性）。

但有些格式问题，如“哪里人”的答复里包含了markdown图片格式，不适合文本展示。

试下文章查询功能。

问：对话系统文章
答：对话系统文章：https://wqw547243068.github.io/dialogue-system

公众号原生支持关键词回复，只要提问内容命中关键词，就会返回指定回复。

但这种方式太过死板，需要一字不差的精准匹配才行，体验并不好。

迁移到扣子Bot后，问题迎刃而解，大模型会根据语义自动匹配合适的关键词配置信息，加工回复。

另外，还支持文章内容问答。

问：这篇文章讲什么
答：这是一篇对话系统文章。。。。

如果有问题不在预设范围内，或反馈问题，还可以帮忙收集、存储。

当然，对话效果并不完美，测试发现，当前模型的不足：

习惯回复markdown格式（表格数据中链接总被识别成图片），prompt中强调后，仍未改进；
插件调用：时间长，失败率高
拒识较多，经常道歉
数据库功能失效。

原因可能跟system prompt、基座模型能力有关。

案例如下：

测试是否能收集用户问题、填表：失败。

查天气案例：

模糊意图（太阳出来了吗）无法识别

导航插件：地图精灵调用不稳定

B站视频搜索：

微信文章搜索：尝试3次，均以失败告终。

查新闻：调用头条新闻插件

政治问题上，豆包的回答颇为谨慎，总是拒识。

（4.2）AI助理构建方法

以上功能如何实现？

步骤总结

①Coze 上创建bot
②选择大语言模型：豆包、kimichat的moonshot
③设置知识库

文章标题
关键词回复
文章内容

④系统提示词: bot 人设、功能、限制条件等
⑤添加插件

头条搜索的search、必应搜索的bingWebSearch、搜狗搜索的sougou

⑥其它

开场白、预置问题、语音风格、聊天背景等

⑦预览调试无误后，发布到公众号

3种类型: 服务号、订阅号、客服

⑧配置公众号：登录公众号后台，获取开发者id(app_id), 并填入coze

注意：

一个 Bot 只能发布到一个微信订阅号

进入扣子平台（coze.cn），注册后，开始创建Bot。

设置名称、描述语（主要面向用户，非system prompt），logo支持AI生成，也可以自行上传。

显示刚创建的Bot：鹤啸九天的个人助理。

设置Bot高级信息：bot 人设、功能、限制条件等

系统提示语（system prompt）：设置AI助理的人设信息，这里可以把数值写入prompt中，也可以调用变量。提示语除了人设，还有功能描述、回复风格、注意事项等板块。
变量：便于多处使用，通过双括号形式引用
开场白：新用户欢迎语，包含文案、预置问题
用户问题建议：每次问答时，系统会生成下一轮问题建议
背景图片：调试窗口、豆包里的背景图
角色：语音播放时启用个性化音色。
插件：添加相关插件（如搜索），提升助理能力。如果是复杂流程，建议使用工作流（workflow），甚至是多智能体。
知识植入：有多种形式，文本是非结构化知识（如文章内容/书籍），表格是结构化信息（关键回复清单，支持excel格式）、照片（后台会生成描述并支持图片问答）。
数据库：用于存储结构化信息，如用户建议、未解决的问题
长期记忆：需要长期存储的信息