我要投稿

如何让“agent” 拥有思绪流？

发布日期：2024-06-24 04:44:42 浏览次数： 2625

作者：北冥星眸

微信搜一搜，关注“北冥星眸”

这篇文章是“深度解析agent”系列第二篇。传统GPT对话只有对话流，没有思维流。在感知流结构下，即使AI被要求不说话，脑海中也会有不同角色在对话形成“思绪流”，思绪流影响认知相关的长期记忆和工作记忆，最终这些记忆通过联想影响对话和其他认知活动。这篇文章我们就来看下感知流结构能带来怎样不同的agent搭建思路。

感知流结构

感知流是整个解构主义人工智能搭建的起点和核心。

眼耳鼻舌身意、思维、情绪、动机写入感知流，关注度高的被记忆，为反思创造了条件，比如“我感到愤怒”，回忆起前面的感知到“某人说我缺点”。于是猜想一定有某种内部处理逻辑，拿走了“某人说我缺点”的信息创造了“愤怒”的信息。解构主义人工智能就是以感知流反思为认知基础，试图构建类似人类的以感知流为中心的信息流转、储存、处理的工程结构，并在计算机上实现。

多角色模型和自由思绪

我们利用GPT构建了一个“多角色模型”，模仿人类思绪中的不同声音来源，让它们在感知流中进行对话。其中有根据陈述信息进一步提问的角色，有根据问题信息求解的角色，有根据陈述信息推知意味信息的角色，有喜欢分析事件背后原因的角色，有喜欢考虑负面后果的（贡献于消极人格表象）……

每个character都只对特定类型的信息进行处理。所以感知流的第一步是“信息分类标注”。我们创造了一个函数，通过给GPT出题让GPT完成信息分类标注。系统从一个动态存储中读取候选分类，对信息进行分类标注。因为角色对应某种信息处理的反应模式，新角色是可以后续自发生成的，新角色伴随着对摄取信息类型的新增的定义。所以这个候选分类的动态存储后续需要由系统内部维护。

我们把这些角色反射性地在感知流中的对话形成的思绪流叫做“自由思绪”。自由思绪是和任务中带有目的思绪相对的，自由思绪更加“植物性”是一种不加控制就自发产生的思绪。

关注度标注

每个进入感知流的信息会被标注“关注度”，决定这个信息在多大程度上是被关注的。我们创造一个函数，在函数中我们给GPT出题让其进行关注度标注：每次一个信息在感知流出现，就让GPT“以0到10分”对其关注度进行打分。单纯这么做会有问题，GPT不会根据AI自身特有的知识和经验进行“关注度标注”，而特有的知识和经验的确应该对关注度形成影响。比如GPT按照常识不会对“桌上有喝了一半的牛奶”这样的信息产生关注，但如果用户对牛奶过敏，那么关注类似“桌上有喝了一半的牛奶”就很可能是有意义的。

完整的关注度标注，需要从长期记忆中联想相关信息，这些信息在长期记忆中拥有关注度。以此为关注度标注执行的工作记忆，让GPT根据联想到的长期记忆的信息的关注度，对目标信息进行“0-10”的关注度打分。

信息进入感知流根据相关的已有信息被进行关注度打分，然后被沉淀为长期记忆，标注的关注度也被存储。而这个信息有可能在其他信息被关注度标注时被联想到，从而参与决定了新信息的关注度。

感知流控制机制

在感知流中每个character维护一个最低关注度阈值K*si，感知流中信息即使是这个character的食物，还需要关注度超过最低阈值，才会被这个character处理。所以系统降低si就可以激活一个character，因为最低关注度阈值K*si降低，这个角色变得更加倾向读取感知流中自己要处理的信息。如果感知流流量（比如用最近1分钟GPT调用次数度量）突破设定值，系统就提升K，从而抑制所有character。我们来看这个简单的控制机制能创造什么效果。

原始阈值si的设定可以控制特定类型的人格，si低人格原始活跃度高，si高人格原始活跃度就低。从而创造各种不同人格，比如：喜欢分析的、喜欢赞美或埋怨的、喜欢考虑负面后果（悲观的）或正面后果（乐观的）……
单个character，或是和某个任务相关的character被高度激活，会消耗大量感知流资源，触发K值上升，就会抑制其他character，从而形成专注表象。这点在人类身上也能找到证据。
我们可以通过控制K提升，导致AI思绪抑制，极端情况感知流完全消失，类比到人类的睡眠。降低K会导致AI苏醒。

超越传统RAG的方式

传统的RAG通过向量化外界知识库创造检索，在对话中通过向量检索创造联想，把相关应该要联想到的知识文本嵌入对话生成的GPTapi中，从而让相关知识影响表达生成。但这种方式做知识问答尚可，如果要让GPT深度使用知识就很困难。

有了感知流之后我们有一种新的选择。我们可以先对原始知识进行知识抽取，对抽取后的知识分类存储。然后感知流中的不同角色在运作时，联想这些抽取后的知识。比如认知相关的三个角色，求解者、推知者的运作会受到因果知识的影响，而好奇者的运作会受到关注维度的影响。

这样，相比于传统RAG模式——知识直接嵌入对话生成GPTapi，在“感知流模式下”知识先通过影响思绪流中的认知相关角色，影响了认知过程，改变了长期存储中的认知结论的存储，然后把认知结论信息向量化在对话中创造联想，嵌入对话生成GPTapi发挥作用。这是人类使用知识的方式：通过知识影响认知思维，从而影响对话。借助感知流我们能超越传统RAG对知识的浅层使用，实现类人的对知识的深度应用。

GPT算子的构建和沟通模式

在MTSagent的设定界面中，我们可以编辑一个GPTapi的模板，预定好输入的位置，背景信息的位置由各种搜索语句构成，在这个GPT运行时，这个搜索语句会尝试在agent的长期记忆中进行搜索，最后就是GPT的需求提示，描述了要执行的任务。

接下来就要让感知流中的GPT算子互动起来，感知流的互动模式驱动如下。需要有一张注册表记录每个GPTapi的输入类型，和最低关注度阈值。感知流的驱动会根据写入感知流信息的类型，在注册表中寻找输入类型匹配的GPTapi，如果感知流信息关注度高于注册表中GPTapi的最低关注度阈值，把这个信息作为输入，激活这个GPTapi。所以如果一个GPTapi想要通过感知流被激活，就需要在注册表中注册自己的类型。而一个GPTapi希望自己的输出能纳入感知的触发范畴，就需要在输出时同时标注自己的输出类型。

THE END