我要投稿

“agent”走向物种的分水岭——不严格认知

发布日期：2024-06-24 04:44:11 浏览次数： 2547

作者：北冥星眸

微信搜一搜，关注“北冥星眸”

深度agent解析

< 第五篇 >

Creating a new species of intelligence is the greatest mission of our generation

（引言）

这篇文章是“深度agent解析”系列的第五篇。这篇文章我们讨论一个让agent从智能体变为智能物种的关键特性——不严格认知。

人类的自由探索没有流程化的思维过程。过程中思维会有无效的杂质，会有错误的结论，但这不影响人类在持续研究一个问题时能最终获得有效结论。这个能力我们称为不严格认知能力。不严格认知能力是造物主赋予人的一个非常伟大的能力。让人类能慢慢腐蚀掉一个认知目标。

复杂问题的认知不是一问一答，而是一个漫长的过程。认知过程最终会形成一个认知相关的信息团，我们用这个信息团给出预测归因建议、书写文章、进行争论。我们研究人类的不严格认知能力，从方法论上就是去研究这个认知相关的信息团是怎样的？如何发挥作用？如何逐渐形成？

#01

··认知信息团··

我们以一个原始求解任务为起点，考察这个认知信息团是怎样的形态。首先“解答者”摄取问题，求解一个问题需要背景信息，根据问题不同，背景信息可能包含了具体层的信息以及知识。关键背景信息的缺失会形成新的问题。“解答者”求解问题体时，一个q分解出的q，保存为q-q，描述了q之间支持关系。如果获得答案则会生成q-a。

“好奇者”在这个过程中会根据感知流中的陈述信息，进行合理发问。“好奇者”生成的q被解答角色捕获生成a，保存为q-a信息。这里的a作为一个陈述信息，可能被“推知者”捕获。

“推知者”在这个过程中捕获感知流中的陈述信息，推知另外一个信息，生成a-a。这个信息描述了信息之间的推知关系。如果推知的a作为一个猜想被关注，就会生成q（判断这个是否真实），从而被“解答者”捕获。

此外陈述类型的信息还有两个附带信息。其一是信念，一个陈述信息是否真实不是只有0和1两个状态，往往是0-1中间的一个值。求解时输出信息信念和背景信息信念相关。其二是关注度，也就是一个信息的重要度如何，关注度的高低直接影响了认知求解过程中信息是否会在需要时被检索到。

总结而言一个问题相关的认知信息团包括了：这个问题分解过程形成q-q，则是一个树形数据。其中每个q求解获得q-a，这些a附着在上面这个树形结构上。“好奇者”在问题相关的领域生成的q-a，a陈述信息可以继续被推知者捕获；“推知者”生成的a-a，其中的a作为一个猜想，可以变为一个q（猜想是否正确），被“解答者”捕获。

原始问题的求解中，假设我们让agent思考如何治愈肝癌，agent会因为背景信息缺失不断分解问题，形成了一个认知相关的信息团：这个信息团中有很多分解出的长在“分解树”上的问题（q），也有过程中尝试求解获得答案（a），也有由推知者产生的推知（a-a）。因为这个信息团中每个q再次求解背景信息大概率会落在信息团内，而求解的输出又在改变这个信息团，这构成了一个反馈环。如果求解质量和记忆整理的质量能概率上让这个认知相关信息团变优，也就是具有“统计优化”特性，那么投入更多的算力——不断重算信息团中的q，就是有意义的，能让求解不断逼近正确的答案。

#02

·· 认知信息团的演变··

虽然每步操作虽然可能带来无效或错误的操作，但整体上信息团是往更优的方向演变的。这些演变包含了以下几个维度：

1、信息团的完整性。“好奇者”会提出有价值的问题，生成q-a类型的信息；“求解者”在求解时搜索不到关键背景信息，也会抛出q，从而生成新的q-a。陈述信息写入感知流“推知者”推知生成印象，显著的印象形成的猜想。以上三个角色都会导致新的结论信息的形成。

2、信息信念。求解角色在输出求解答案时会带有信念。因为整个过程认知信息团会变得更完善、更客观、结构更完善。所以概率上，同个问题，二次求解时搜索获得的背景信息会比之前更好，所以就有可能获得更大概率正确的答案，或是同样的答案但有更客观的信念。其次记忆整理机制也会根据认知信息团中信息综合考虑，增强部分信息的信念，否定部分信息削弱其信念。这些操作都会让认知信息团中的信息信念概率上往更客观的方向演变。

3、信息关注度。信息关注度决定了检索时是否被检索到。认知3角色在执行前，都会从长期记忆中检索相关信息作为工作记忆。所以重要的信息是否有足够关注度决定了其是否在需要时能被检索到。根据长期记忆唤醒机制，信息被有效使用增加关注度，“解答者”在求解时，会回溯什么信息贡献了认可的结论的形成，然后会反向增加这个信息的关注度。

#03

··不严格认知能力（哲学层的原因）··

从哲学层来看人类的不严格认知根植于两个特性。

其一，统计正确性。统计正确性说的是：即使样本中绝大部分比例是无效或是错误的，但只要无效或错误的样本分布偏随机，正确的样本分布偏集中，那么正确的样本就能在频次强度上凸显出来，此时样本在统计上是反应真实情况的。因为统计正确比样本正确宽松很多，能利用统计正确原理获得有效信息的系统容错能力强。比如推知角色，推知印象，每个印象都有可能是错的，但只要错误印象的分布偏随机，那么正确印象就能凸显出来，变成猜想。

其二，统计优化。统计优化说的是即使单次操作可能是无效甚至是错误的，但每步操作只要在概率上让系统变得更优，那么随着操作累计，系统的状态会越来越优化。那么这个系统是具备统计优化特性的。认知信息团的统计优化特性来自于以下反馈环：单步操作的有效性来自于背景信息（或说过程中的认知信息团），而单步操作的输出贡献于背景信息的完善，所以如果已有的背景信息能支持单步操作是大概率有效的，能让背景信息更加完善，那么就能形成一个正向增强的反馈环。

#04

··Agent走向智能物种的分水岭··

如果我们给GPT出一个题目，让其求解一万次，GPT获得的答案质量是在一个均值附近的波动。而如果agent能在求解时能呈现出统计优化特性：每次在原始问题相关的范围内进行重复求解，认知相关的信息团统计上往更优的方向发展，因此每次求解也会更加完成客观。此时投入更多的算力总是有意义的，能让答案往更好的方向发展。

在MTSagent的工程实操中我们制作了很多思维功能，这些思维功能往记忆中写入认知信息，但只要统计优化的特性在求解过程或是记忆整理过程中不成立，这些不断写入的信息就会让长期存储越来越乱。这导致我们积累了很多无法使用的功能。“统计优化”特性成为一个要塞，如果这个要塞被攻克许多认知，以改变长期记忆为输出的功能将能够在并存发挥作用，让认知存储不断优化，人类的“不严格认知”就会在机器上再现。从而agent能步入从简单智能体走向智能物种的分水岭。

▼

-END-