AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


为什么你的Agent还是个Chatbot?
发布日期:2024-12-27 06:58:12 浏览次数: 1550 来源:产品二姐


1. 引言

关于AI agent的交互模式,最近显得有点"囧"了。
一边我们吹牛给客户说 Agent 无所不能,另一边客户拿到 Demo 一看,不就是个 Chatbot 聊天机器人吗?
一边90%的人都在说 Chatbot 不是理想的交互模式,但另一边 90%的 AI agent 应用又都是 Chatbot。
包括在 GPT-4o 中展现的超自然对话模式也不是理想交互模式,至少在办公场景不是。我甚至觉得甚至大家可能都被ChatGPT带入了思维定势。
不过最近有些新的思考和观察,拿出来和大家一起探讨,也许能帮助我们跳出这个定势思维。首先和大家聊聊观点,然后拿几个产品案例来学习。
受限于本人的业务范围,这些思考更专注于 ToB 的场景,ToC 场景有意思的交互也欢迎大家留言。

2. 开门见山: 在场景中实现人与 Agent 的协同。

想想我们从 word 文档到飞书文档,从 sketch 到 figma,其本质的不同是将单机工具变为协同工具,节约了大量沟通成本。在云计算时代,仅仅依靠协同这一杀器突出重围的还有 Mural,Trello 等一大批产品。
同样在今天,我们想要突破 Chatbot 这种形式,本质上是在寻找人和 Agent 的高效沟通方式。显然聊天不是最高效的方式,因为人类 80%的信息是由视觉输入获得的 ,这是自然法则,从最初的感官细胞进化到今天的视觉系统,经历了几百万年的考验,没有谁能违背。
基于这一法则,我们以白板为出发点。想象这样一个场景:你在和一位同事白板前讨论问题,而这位“同事”就是一个 Agent。
1.首先你在白板上写道:“一个关于 Agent 的调研”。图中的气泡可能只是内心
2.然后同事在画布迅速画出一个思维导图,图显然比文字可读性更强。
3.看着思维导图你会发现,这里缺点什么东西。于是在白板上增加了几点内容(图中黑色部分)
4.你的同事迅速反馈,并在你的项目上又增加了一些想法和创意。
5.你们两个如此反复,最终通过这种互动方式做出来一个调研思路。然后你告诉同事“就按照这个大纲来写出完整的报告吧。”
6.之后同事根据这个思路利用工具总结出了一份完整的报告,并且拿着报告来和你审对。这时候,你们的沟通载体变成了飞书文档。
7.看过文档之后,你对他的文档增加了基础评论、建议。
8.你的同事根据建议生产出一份完整的报告。
9.最后你们二人击掌,庆祝完成。(当然这一步是假想的)


这个过程就是我所想的:人与Agent的场景化协同模式,它与当下的人-人协同模式的区别是:

人与人协同:其中有一个人来做具体执行工作,且不断地催促各位建议方完成自己的任务。整个执行过程要占掉全部工作 80%的时长,而文档的核心价值--其中的思想和创意,仅仅占掉整个工作 20%的时间。
人与Agent 协同:这个执行的人变成了 Agent,甚至变成了那个天天追着你要结果的“驱动方”,而人负责指导、建议,真正把人从执行中解放出来,这看上去真是太美好了!

要达到这样美好的人与Agent 协同,在形式上有几点区别于ChatBot:

1. 在 Chatbot 中,人处于主动发起和核心执行者,而新的人-Agent 协同方式,Agent 比人更主动,更具备执行力
2. 沟通媒介从 Chatbot 变成了白板、框架图、文档编辑界面,当然我们还可以有更多的载体。
3. 人在其中通过手把手,而不是说话的方式对 Agent 进行了有效的控制,而这也是当前 Agent 开发的关键。

在想到这一点之后,我非常兴奋的发现在 Globe engineer ( https://www.globe.engineer,出品AI 版维基百科explorer globe的开发团队)也展现出了类似的交互模式,虽然略显粗糙,但很有用,大家一定要去看。核心就是人-Agent协同,人占据主动位置,执行由Agent 来进行。



在此基础之上,我们再来多看几个产品。


3. 产品案例
以下丰富的案例都是我在 YC(美国最大天使投资机构)项目中找到的,不得不说,在 AI 应用萌发的初期,YC 项目中的 idea 真的是非常鲜活,有新意。YC 项目已经成为为经常反复浏览的灵感源库(我已经整理出来放在飞书表格里, 关注公众号回复“YC2024” 可得)。

案例 1:在 Coding场景中协同
Github copilot 是非常好的案例。Copilot 出现在左侧,与用户呈现出 1v1 结对编程的场景化,ta不需要用户刻意唤起,或者时常提醒,对用户造成打扰。


类似的另外一个案例是 https://marblism.com, 在这个产品里,只要输入一句提示词,就可以生成一个网站。在网站生成后,同样在左侧出现类似结对 编程的界面:比如图中marblism bot 会自动产生一项code review建议,阐述原因并向用户汇报,而用户只需要点击确认一下,Agent就可以按照建议修改代码。


案例 2:在流程中协同
第二个案例是在流程中协同。和上述画布中绘制脑图的过程类似,在这里 Agent 生成了决策树,用户可以在决策树中增加新的节点,来控制 Agent 的输出内容。案例来自 https://centauri-ai.tech/


案例 3:在文档中协同
我们之前提到,在飞书文档中,用户以“Comment”的方式和 Agent 协同,这里也看到了一种相反的模式,但这里的场景是:Agent 需要根据最新的合规要求,对企业内部现有文档提出相应的修改建议,然后由人来决策是否修改。参考:https://www.pincites.com/
相信未来还有很多案例值得大家去探索、创造。
4. 总结

总结一下,今天和大家的探讨集中在用户层,着重在包装,这往往被技术人员忽视,但却对市场、用户来说非常重要,甚至用户就是单纯地会为用户体验买单。

最后,唯有跳出Bot,不是Bot,才是一个好Bot。

本文排版借鉴了公众号赛博禅心的排版,希望可读性会更好。




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询