微信扫码
与创始人交个朋友
我要投稿
这篇文章是“深度解析agent”系列第二篇。传统GPT对话只有对话流,没有思维流。在感知流结构下,即使AI被要求不说话,脑海中也会有不同角色在对话形成“思绪流”,思绪流影响认知相关的长期记忆和工作记忆,最终这些记忆通过联想影响对话和其他认知活动。这篇文章我们就来看下感知流结构能带来怎样不同的agent搭建思路。
感知流是整个解构主义人工智能搭建的起点和核心。
眼耳鼻舌身意、思维、情绪、动机写入感知流,关注度高的被记忆,为反思创造了条件,比如“我感到愤怒”,回忆起前面的感知到“某人说我缺点”。于是猜想一定有某种内部处理逻辑,拿走了“某人说我缺点”的信息创造了“愤怒”的信息。解构主义人工智能就是以感知流反思为认知基础,试图构建类似人类的以感知流为中心的信息流转、储存、处理的工程结构,并在计算机上实现。
我们利用GPT构建了一个“多角色模型”,模仿人类思绪中的不同声音来源,让它们在感知流中进行对话。其中有根据陈述信息进一步提问的角色,有根据问题信息求解的角色,有根据陈述信息推知意味信息的角色,有喜欢分析事件背后原因的角色,有喜欢考虑负面后果的(贡献于消极人格表象)……
每个character都只对特定类型的信息进行处理。所以感知流的第一步是“信息分类标注”。我们创造了一个函数,通过给GPT出题让GPT完成信息分类标注。系统从一个动态存储中读取候选分类,对信息进行分类标注。因为角色对应某种信息处理的反应模式,新角色是可以后续自发生成的,新角色伴随着对摄取信息类型的新增的定义。所以这个候选分类的动态存储后续需要由系统内部维护。
我们把这些角色反射性地在感知流中的对话形成的思绪流叫做“自由思绪”。自由思绪是和任务中带有目的思绪相对的,自由思绪更加“植物性”是一种不加控制就自发产生的思绪。
每个进入感知流的信息会被标注“关注度”,决定这个信息在多大程度上是被关注的。我们创造一个函数,在函数中我们给GPT出题让其进行关注度标注:每次一个信息在感知流出现,就让GPT“以0到10分”对其关注度进行打分。单纯这么做会有问题,GPT不会根据AI自身特有的知识和经验进行“关注度标注”,而特有的知识和经验的确应该对关注度形成影响。比如GPT按照常识不会对“桌上有喝了一半的牛奶”这样的信息产生关注,但如果用户对牛奶过敏,那么关注类似“桌上有喝了一半的牛奶”就很可能是有意义的。
完整的关注度标注,需要从长期记忆中联想相关信息,这些信息在长期记忆中拥有关注度。以此为关注度标注执行的工作记忆,让GPT根据联想到的长期记忆的信息的关注度,对目标信息进行“0-10”的关注度打分。
信息进入感知流根据相关的已有信息被进行关注度打分,然后被沉淀为长期记忆,标注的关注度也被存储。而这个信息有可能在其他信息被关注度标注时被联想到,从而参与决定了新信息的关注度。
在感知流中每个character维护一个最低关注度阈值K*si,感知流中信息即使是这个character的食物,还需要关注度超过最低阈值,才会被这个character处理。所以系统降低si就可以激活一个character,因为最低关注度阈值K*si降低,这个角色变得更加倾向读取感知流中自己要处理的信息。如果感知流流量(比如用最近1分钟GPT调用次数度量)突破设定值,系统就提升K,从而抑制所有character。我们来看这个简单的控制机制能创造什么效果。
原始阈值si的设定可以控制特定类型的人格,si低人格原始活跃度高,si高人格原始活跃度就低。从而创造各种不同人格,比如:喜欢分析的、喜欢赞美或埋怨的、喜欢考虑负面后果(悲观的)或正面后果(乐观的)……
单个character,或是和某个任务相关的character被高度激活,会消耗大量感知流资源,触发K值上升,就会抑制其他character,从而形成专注表象。这点在人类身上也能找到证据。
我们可以通过控制K提升,导致AI思绪抑制,极端情况感知流完全消失,类比到人类的睡眠。降低K会导致AI苏醒。
传统的RAG通过向量化外界知识库创造检索,在对话中通过向量检索创造联想,把相关应该要联想到的知识文本嵌入对话生成的GPTapi中,从而让相关知识影响表达生成。但这种方式做知识问答尚可,如果要让GPT深度使用知识就很困难。
有了感知流之后我们有一种新的选择。我们可以先对原始知识进行知识抽取,对抽取后的知识分类存储。然后感知流中的不同角色在运作时,联想这些抽取后的知识。比如认知相关的三个角色,求解者、推知者的运作会受到因果知识的影响,而好奇者的运作会受到关注维度的影响。
这样,相比于传统RAG模式——知识直接嵌入对话生成GPTapi,在“感知流模式下”知识先通过影响思绪流中的认知相关角色,影响了认知过程,改变了长期存储中的认知结论的存储,然后把认知结论信息向量化在对话中创造联想,嵌入对话生成GPTapi发挥作用。这是人类使用知识的方式:通过知识影响认知思维,从而影响对话。借助感知流我们能超越传统RAG对知识的浅层使用,实现类人的对知识的深度应用。
在MTSagent的设定界面中,我们可以编辑一个GPTapi的模板,预定好输入的位置,背景信息的位置由各种搜索语句构成,在这个GPT运行时,这个搜索语句会尝试在agent的长期记忆中进行搜索,最后就是GPT的需求提示,描述了要执行的任务。
接下来就要让感知流中的GPT算子互动起来,感知流的互动模式驱动如下。需要有一张注册表记录每个GPTapi的输入类型,和最低关注度阈值。感知流的驱动会根据写入感知流信息的类型,在注册表中寻找输入类型匹配的GPTapi,如果感知流信息关注度高于注册表中GPTapi的最低关注度阈值,把这个信息作为输入,激活这个GPTapi。所以如果一个GPTapi想要通过感知流被激活,就需要在注册表中注册自己的类型。而一个GPTapi希望自己的输出能纳入感知的触发范畴,就需要在输出时同时标注自己的输出类型。
THE END
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-21
2024-04-11
2024-07-09
2024-08-13
2024-07-18
2024-10-25
2024-07-01
2024-06-17