iaiuse: 用GPTs纯提示词简易复刻coze大赛冠军,workflow我要你何用
写在前面
GPTs复刻版效果
GPTs 源码
前情提要
waytoagi社区借coze共学的机会,大力宣传coze比赛,极大调动了大家的学习热情。sd大神三思三爷贡献了宝贵的提示词,在stuart的帮助下,经过不眠不休的共同创作,取得了数千人参与,近万次的会话。这种精神,极大鼓舞了社区的创作热情。
去年是 chatbot 的元年。人们对 AI 交互投入了极大的热情,这是科技史上罕见的现象。尽管这些技术仍然不够完善,人们却表现出了极大的宽容。
今年,以coze为首的AI平台摒弃了过往的一些傲慢与恐吓,开始在agent平台发力。coze通过高速迭代和持续优化,迅速在所有agent平台中脱颖而出,吸引了众多AI爱好者的关注,特别是它的图像生成功能。让社区中的图像高手,如三思和pusa等KOL都表示要开始学习coze。因为AI从一个微小的工具,真正变成了有用的工具。通过workflow的能力,让AI进入了普通人的工作和生活。
在这样的背景下,coze精心准备的这场比赛,让创意迸发,扩大知名度也是自然而然的事了。接下来我们从创意,技术和用户体验等角度一起来看看本次大赛的冠军作品。
原Coze版实际体验
这里配图可以看出是非常用心的。从标题上我们可以看出来,言简意赅就点出了主题,让人想要点进去看。这点非常值得学习。
打开以后是这样一个页面。可以看出来,开场白预置问题和开场白预置文案都非常用心。使用了粗体斜体,突出重点,表情符号的运用,降低了整体的认知负荷,在agent的当前框架内,几乎是最好的呈现了。
如何降低专业知识的认知负荷
我们知道在提示词技巧中有一个few-shot,也就是通过简单的示例,让 AI 了解我们希望做的事。在这个bot中,非常巧妙的通过3个 预置问题,让人们了解如何设定 疾病种类和 难度。让用户更好通过这个bot获得自己想要的内容。
同样地,通过下面的5个按钮,能快速让用户了解如何和它交互。非常值得专业领域,比如教育,法律等通过这样的方式,让使用者快速上手,减少对专业知识的畏惧。
多轮输出,量大管饱
一次提问,它能完整通过多张带图片的卡片展示出来,是非常难得的。前后的一致性能做成这样,基本可以满足大部分需要了。最后给出了选项,我们试试看它的交互。
层层递进,逐步交互
正如它最初设定的那样,5轮以后,就结束了,但是结束以后依然可以交互。等会我们尝试解析一下它的技术实现。从用户体验的角度来说,后面的按钮就不应该再进行交互了,而是应该给出重新开始或者其他的内容。
兼顾易用性和专业性
下面的5个按钮,前面3个是选择用的,简单明了,每次会根据前面的内容推进。后面的2个按钮,是用来确定性的使用。
我们看下它的效果
回溯考虑
为了方便测试,不假思索一直点下去,它出现了一个回溯: 问题三做了一次重新提问。暂时还不知道它的原因。
整体来说,在用户体验上,降低了使用门槛,图文结合,多张卡片一起输出,非常值得学习。建议优化的部分主要体现在:
创意先行
很多人认为 AI 是一个玩具,很大程度上是因为把 AI 当成了普通的技术手动,在原有的业务流程中嵌入 AI, 让它来降本增效,结果会发现很快受挫,因为这样很难发挥它的真正价值。
本次获奖的作品,在创意上十足下了功夫,让我们了解到,AI 使用的无限可能,也让我们发现了如何和AI结合的无限可能。
它选择的创意是医学领域的一个分支,急诊室,类似模拟教学的场景,通过这样的一个交互式案例,完全可以把教学内容展示给学生。
传统上,我们会通过非常复杂的教学系统来完成这样的工作,需要准备大量的内容,并分析上下文匹配知识库的内容。中间的工作量非常巨大。
生成式 AI 很大的价值就在于语义理解,动态生成。从这个案例上,我们可以看出来。
优点
逼真且有沉浸感:
互动性强:
情感共鸣:
不足
互动设计尚需完善:
AI反馈系统可以更智能:
用户个性化不足:
行业应用
医学培训:
公共健康教育:
创意在 AI 元年是至关重要的,看到了更多可能性,才能更好和自己行业结合。
接下来,我们尝试解析它的技术实现。
技术实现
开始之前,结合我们上面的分析,下面一共5个按钮,前面上个用来驱动剧情,重新开始是调用工作流用的,最后一个单纯的提示词总结。相对复杂一些的技术实现就是工作流中嵌套的图像流。经过社区的几次共学,这部分技术难度对于社区小伙伴来说不在话下。
加上工作流输出的卡片绑定,和工作流的多轮输出,通过工作流推动剧情发展,就构成了整个bot。可以看出来,在这个bot的场景中,既没有涉及自有plugin,也不涉及数据库,用户状态,外部系统交互等coze比赛期望展示的多个技术组件使用,技术难度上是乏善可陈的。(因为没有在插件市场和工作流市场找到这个bot开放的内容,如果有小伙伴找到了告诉我下)
也正因此,也是体现了 AI 时代技术平权的真谛,创意更重要!我们开始进入主题。
模型选择-kimi
首先我们看下它的配置项,使用的kimi的模型, 选用的是32k的:
目前coze上支持的大模型有这些,32k选择的模型有GLM-4,Moonshot,MinMax和百川,从前面对话的内容来看,似乎8k也是足够的,不太确定bot作者选定这个模型的理由,个人倾向于通义,底模决定了bot的能力,上层的雕花完全无法覆盖模型本身的不足。从最后呈现效果来看,在这个bot中足够了。我们接下来看看它的提示词。
人设和回复逻辑
我们先看下它的提示词设定
从这里我们可以看出来它的整体逻辑是沿用江树 langgpt 的结构,通过 markdown 来区分重点。
优点
清晰的人设:明确了助手的身份、角色和能力,设定了医学教授的背景,并结合写作能力,这样可以提高助手的权威性和可信度。
详细的回复逻辑:分步骤描述了故事启动、互动发展、问题提问、评分机制和游戏总结,逻辑清晰,便于理解和实现。
具体的技能描述:明确了融入医学知识、探讨主题和伦理议题、保证专业性和通俗易懂的技能,这些技能能提升游戏的教育价值和趣味性。
注意事项和运行稳定性:强调了游戏的公平性和教育性,说明了助手的稳定性和广受好评的事实,增强了用户对助手的信任感。
简洁的总结:最后强调了回答问题前的深呼吸步骤,表明了助手对回答质量的重视。
改进
过度详细:提示词的设定过于详细,可能会影响模型的灵活性,限制了助手的自由发挥。
缺乏用户反馈机制:没有提到用户反馈的处理和改进机制,无法保证游戏体验的持续优化。
过度强调稳定性:强调上百年的稳定运行过于夸张,可能降低可信度。
过度依赖评分机制:过于强调评分机制,可能导致用户体验不佳,建议增加更多互动元素。
功能说明不足:对 ts-emergency-emergency 函数的具体功能说明不足,可能影响理解和实现。
工作流 emergency
图像流
从上的内容可以看出来,第一次回答会包含 3 个卡片,第一张卡片和最后一张卡片会有图像。
这 2 张图,可以使用不同的图像流,也可以使用同一个图像流,通过传参数的方式生成图片就可以了。
记分组件
我们看到每次回复都通过卡片来绑定的。但是并不是每次都会记分,也不是每次都通相同的形式记分,猜测它可能并没有严格实现这部分,而是通过大模型来处理。通过提示词来评估这个操作是加分还是减分,但是不会累加,和最后得分,所以猜测它应该没有使用变量和数据库。
故事节点
从上面的图上我们可以看出来,【问题 x】,这里是会有区分的,从问题一到问题五。这里通过提示词应该是可以实现,不需要记录状态,能确保【问题 x】不错乱就可以了。输出可以通过 few-shot 限定。
您选择了。这是,加10分。
【问题x】 。现在,您需要决定下一步的行动。
A.
B.
C.
请问您选择哪个选项?
尝试用GPTs模拟
你是一个智能医疗助手,帮助用户在模拟急诊室环境中做出医学决策。每个决策都有三个选项,根据用户的选择来评估加分或减分,并提供相应的反馈。如果用户选择正确,加分并前进到下一个问题。如果用户选择错误,减分并返回到上一个问题。当用户完成五个问题后,进行整体结果总结。
### 示例:
用户选择了行腹部CT,观察是否有内脏器官损伤。这是一个效率高且比较正确的方法,加10分。
【问题一】腹部CT结果显示没有明显的内脏器官损伤,但发现盆腔内有少量积液。现在,您需要决定下一步的行动。
A. 考虑到可能存在炎症,决定进行血常规和C反应蛋白检测。
B. 考虑到可能存在宫外孕的风险,决定立即安排盆腔超声。
C. 考虑到可能存在消化系统问题,决定进行腹部超声检查。
请问您选择哪个选项?
【用户选择】B
【反馈】选择正确,盆腔内积液可能是宫外孕的征兆,立即安排盆腔超声是合适的决定,加10分。
【下一步】用户选择正确,继续进行下一个问题。
### 模板:
用户选择了{初始决策描述}。这是一个{决策评价}的方法,加{加分}分。
【问题x】{初始检查结果描述}。现在,您需要决定下一步的行动。
A. {选项A描述}
B. {选项B描述}
C. {选项C描述}
请问您选择哪个选项?
【用户选择】{用户选择}
【反馈】{选择评价},{详细解释},{加/减分}。
{下一步操作}
### 具体问题和总结部分:
【总结】您已完成所有问题,根据您的选择,您获得了{总分}分。以下是您的总结:
1. 腹部CT结果显示无内脏器官损伤,但盆腔有少量积液。
2. 您选择进行盆腔超声检查,发现卵巢有囊肿。
3. 进一步的MRI检查显示囊肿是良性的,但有增大趋势,您选择手术切除。
4. 手术后,您正确处理了术后轻微发热,通过血液培养排除了感染。
5. 最终,您通过使用抗炎药物成功减轻了患者的术后炎症反应。
整体而言,您的决策显示出对医学知识的正确理解和应用。感谢您的参与!
从这里,我们就能看出来,通过简单的提示词,就能实现类似的效果,相比而已图像流的能力,这部分能力借助 dalle 是可以实现的。另外它也有了积分的能力。
补充说明
整体上,这个 bot 在技术实现上,图像流的结合,和工作流整体调度上值得我们学习和借鉴。另外一个角度也说明提示词技能的重要性,社区的文档里面有很多这部分的内容,期待未来 coze 能力更强我们可以做更多的事。