支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


从Manus看AI Agent的自动化悖论

发布日期:2025-03-17 11:37:17 浏览次数: 1573 来源:AI重塑世界
推荐语

Manus发布引发热议,但质疑声不断,本文带你深入探讨AI Agent自动化悖论。

核心内容:
1. Manus发布引发的媒体狂热与迅速转变的舆论风向
2. AI Agent自动化的发展历程与当前发展状况
3. 人机协作自动化模式的探讨与未来展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

引言

自Manus于3月5日发布后,在AI agent领域掀起了一场媒体狂潮。最初是众多KOL的宣传,随后各路媒体纷纷跟进报道——有了上次DeepSeek的经验,大家都不愿落后。产品发布当天,其邀请码被炒至上万元,甚至有人借机发币,导致Manus的X账号被封。各大证券公司也开始发布分析文章,纷纷称之为"国运机遇"、"DeepSeek第二"。

然而不到一天,舆论风向急转直下。产品收到大量差评:性能不佳、运行卡顿、只是套壳应用。事实证明这并非难以复制,GitHub上已出现五个开源复刻项目,其中较为出色的是OWL和OpenManus。值得一提的是,OpenManus竟是三位00后开发者仅用三小时就用metaGPT复刻出来的。随后,多人对这些复刻版本进行了测试并发表了评测文章。

这一切逐渐演变成了一场闹剧。至于Manus的实际表现如何?由于作者也没有收到邀请码,所以就不对这款产品做具体评价了。

许多人预测2025年将成为AI Agent元年。近期,Anthropic发布了MCP协议,OpenAI也推出了全新的Agent工具套件。AI应用的爆发主要得益于Coze、dify等Agent工作流平台,以及大语言模型的基础能力。随着ChatGPT o1、o3和DeepSeek R1展现出强大的推理能力,我们发现可以快速重现AutoGPT的功能,朝着人类的自动化理想迈进。

人们对自动化的追求由来已久。表面上看,这似乎源于人类的惰性——希望只需提出要求,机器就能完成所有工作。但若深入观察人类社会对自动化的真实需求,就会发现这与惰性无关。在当今社会,懒惰是一种奢侈。自动化的真正驱动力是企业对经济效益的追求,本质上是对效率和利润的渴望。

既然人们如此热衷于自动化,今天我们就来分析一下:自动化真的如人们想象的那么美好吗?它背后是否隐藏着一些难以破解的悖论?本文将深入剖析这个问题,主要从以下四个方面展开讨论:

第一,从历史角度看,当今的AI自动化与传统自动化有何不同?我们又该做好哪些准备?

第二,为什么像Manus这样的通用全自动AI agent产品形态并不理想,也不应成为发展趋势?

第三,即便人工智能发展到极高水平,为什么全自动化流程仍难以完全脱离人类?

第四,既然人类无法与自动化割裂,那么一个更和谐的人机协作自动化模式应该是什么样的?

自动化的发展历史

自动机器

早在公元前3500年,让机器替代人工的概念就已在人类意识中萌芽。哲学家、工程师和数学家们致力于制造能够模仿人类行为的自动机械。这些早期的自动设备虽然与现今融合了计算机、程序和人工智能的系统有着本质区别,但开启了人类对自动化的探索。

希腊人尤其推崇自动化的理念。在希腊神话中,火神赫菲斯托斯(Hephaestus)创造的"金仆"(Golden Servants)可以说是最早的机器人管家构想。亚里士多德更是设想了一个由机器人担任主要劳动力的未来世界。到了公元前420年,希腊工程师已经能够开发出由空气、蒸汽压缩和液压驱动的简单自动装置。这些设备主要用于宗教仪式,可以完成开门、装饰等基本任务。

分工生产理论

工业革命为全球自动化发展带来了真正的机遇。自动化的发展源于制造行业的分工生产。

早在18世纪,亚当·斯密在《国富论》中就观察到分工如何提高手工业生产效率。他将效率提升归结为三个原因:第一,熟练度提高。工人专注于单一工序会显著提升熟练程度,从而提高产量和质量。第二,节省转换时间。分工避免了工人在不同工序间切换造成的时间损失。第三,工具创新。对工序的深入了解促使工人发明更高效的机械和工具,进一步提升产量。现代产业链的分工更加精细和专业,使原料到成品的生产更加高效。亚当·斯密用扣针制造过程展示了分工理论:"一个人抽铁线,一个人拉直,一个人切截,一个人削尖线的一端,一个人磨另一端,以便装上圆头。要做圆头,就需要有二三种不同的操作。装圆头,涂白色,乃至包装,都是专门的职业。这样,扣针的制造分为十八种操作。有些工厂,这十八种操作,分由十八个专门工人担任。"亚当·斯密奠定了分工研究的范式,但由于当时工业水平有限,他的理论在企业实践中并未取得实质性进展。

泰勒制和福特汽车

到了19世纪末,蒸汽机已为工业带来巨大发展。美国人弗雷德里克·温斯洛·泰勒(Frederick Winslow Taylor)提出了科学管理理论(又称"泰勒制"),开创了西方管理学理论的先河。他详细记录每个工作的步骤及所需时间,设计出最有效的工作方法,并为每项工作制定标准工作量,将其归纳为标准工作流程。他的目标是通过最经济的方式,用人的动作与时间达到最高的生产量。这与自动化有何关联?正是这些标准工序使自动化成为可能。

福特汽车是泰勒理论最成功的实践者,将制造业的分工生产方式推向更专业化和标准化的水平。20世纪初,亨利·福特采用流水线新工艺,彻底改变了传统生产模式——将单辆汽车的装配时间从12小时缩短至90分钟。通过多年改进装配线,福特降低了制造成本,使Model T汽车售价从850美元降至300美元以下,成为历史上首款大众化优质汽车。最终,福特实现了每24秒生产一辆Model T的速度,到1927年全球销量突破1500万辆,占据全球市场半壁江山。福特的流水线制造方法迅速普及,不仅影响了其他汽车制造商,还推广到留声机、吸尘器、冰箱等消费品制造领域,成为那个时代美国特有的生产方式。

工业自动化

早期流水线的每个工序主要依赖人工操作。随着制造业实现高度分工化、专业化和标准化,工业自动化随之快速发展。生产制造自动化主要经历了三个阶段:单机自动化、单线生产自动化和工厂自动化。在生产流程标准化后,一些单调重复的动作逐步被自动化机器替代,如上下料和装配等。当某个具体工序的所有动作都实现自动化后,就形成了单机自动化。接着,通过程序将流水线上分散的自动化设备连接起来并控制节拍,就实现了单线生产自动化。最后,当程序协调起工厂的进料、入仓、存储、产线、生产、检测、出货等全流程,工厂自动化就此形成。

工业自动化带来了产品生产边际成本的下降,人机结合提高了人力资本效率,这为资本家创造了更多利润。但另一方面,工厂产品也变得越来越标准化,就像现在全世界的人们都在使用同样的iPhone手机一样。

前文描述的自动化主要集中在制造业的工厂生产环节,其对象是传统蓝领工人。然而从1950年代开始,美国白领工人的比例就超过了蓝领工人,如今已占总就业人数的80%。同样,随着近20年来中国高等教育的普及,社会中涌现出大量以电脑操作为主的办公室白领工作者。

白领自动化

由于信息化发展远晚于制造业,当前信息化带来的流程自动化水平也远低于工业自动化水平。简单来说,虽然现今的白领都在办公室使用电脑工作,但企业的整体运营模式仍在沿袭工业时代的模式。

让我们来评估一下信息化领域的流程自动化水平。目前讨论的AI agent自动化主要局限于白领工作,很难延伸到实体场景,这正是我们需要重点探讨的。

首先来看实现自动化所需的基础能力:流程的分工专业化和标准化。

  • 分工专业化:与制造业的大规模生产不同,企业办公室主要在较高层面实行专业分工。企业通常采用定岗、定责、定编的方式,将员工分为不同类型的业务专员,如财务部门的会计和出纳、人力资源部门的招聘专员和讲师、供应链的采购专员和库管员等。但大多数企业的分工精细度仍未达到福特流水线的水平。
  • 标准化:企业普遍制定了规范标准和操作手册,但由于缺乏有效的监管手段,主要依靠信息系统的中台控制和后台数据来检查流程标准化程度。在实际操作中,很难衡量业务人员的标准化程度。过度的标准化限制往往引发员工不满,因为它限制了业务处理的灵活性。不过近年来,随着员工对信息系统越发熟练,许多操作模式和流程逐渐形成了标准化规范。

管理者正在加强内部运营的流程化、规范化和标准化,这三项基础能力都在稳步提升和成熟。尽管企业已建设了大量信息系统,但系统操作仍主要依赖人工,决策和处理都需要人来完成。虽然最终结果保存在系统中,但流程间的协作和串接仍由人来执行。目前企业采用的自动化流程软件,如工作流系统或RPA机器人流程自动化系统,从发展阶段来看,仅相当于单机自动化和单线自动化水平,距离工厂自动化的水平还有很大差距。

无论是为了实现自动化,还是为了便于管理,企业(特别是大企业)正朝着更加标准化、规范化和专业化的方向发展。在这个资本主义工业发展的逻辑中,人工智能的出现是否会改变这种趋势?我们稍后再来探讨这个问题。目前我们讨论的都是企业层面,那么个人用户端又如何呢?

个人自动化

虽然企业追求自动化是为了提高利润,但个人追求自动化往往源于对便利的渴望——不愿动手,不想思考。如今市场上充斥着各类个人自动化产品,从智能音箱、智能手表到扫地机器人,从营养追踪应用到儿童故事机器人。更微妙的是,许多软件中的自动化功能悄然运作,比如抖音和小红书的推荐算法,让我们误以为自己在主动探索内容。

传统的自动化工具中,人是"控制者"——我们用Excel宏提高工作效率时仍然理解数据,用机械臂生产汽车时仍然掌握核心技术。而现今的自动化工具却将人转变为"消费者":AI推荐内容时我们被动接收,AI生成文章和短视频时我们直接转发,不再深究其真实性和逻辑。

当自动化替我们做决定、处理任务时,我们不禁要问:在不需要思考、决策和探索的生活中,我们真的会更幸福吗?这种自动化是否剥夺了生活的趣味?失去亲手操作和探索的过程,是否也意味着失去了生活的乐趣?

人类向左,AGI向右

新的疑问

行业专家常说,无论是企业还是个人的自动化,都是为了减少"低价值重复劳动",让人们能将时间投入到更有意义的事情上。

然而现实恰恰相反。我们减少的不是低价值劳动,而是工作和学习中的知识探索过程。人们不是去做更有意义的事,反而躺在床上刷短视频。企业引入了众多自动化软件和工具,却没有一家企业能让员工早点下班——人们反而抱怨更忙了。从社会层面看,尽管AI和自动化接管了越来越多的任务,我们非但没有变得更自由,反而陷入了新的恐慌,担心它们会夺走我们的工作。

究竟是自动化出了问题?是人类自身出了问题?还是我们与自动化之间的关系出了问题?从今天人们对Manus这类AI Agent自动化应用的狂热追捧来看,人类似乎已经陷入了自动化的深渊。

过去我们使用的自动化与人类社会发展是相辅相成的。如我们所讨论的,现代社会建立在工业革命的基础之上。尽管我们经历了计算机和互联网革命,但从企业经营到学校教育、社会管理,基本形态和模式并未改变,只是从线下转向线上,从蓝领转变为白领,效率和速度得到提升。企业和社会发展的核心目标依然是提升效率、降低成本、追求增长。因此,企业通过专业化分工来降低任务切换成本,提升熟练度,实现规模化生产。企业采用科层制或专业部门的组织结构,通过专业化、模块化分工来控制复杂系统,避免单点失误导致系统崩溃,从而实现资源分配的效率最大化。既然企业和社会需要这样的人才,学校就按照这种方式分专业、分学科培养学生,将一张张白纸训练成专业人才。再加上社会上的各种资格认证和职业考试,这些标准化的筛选方式不仅降低了企业选择人才的成本,也确保了专业服务的可靠性。

人类的认知和个体能力确实有局限性——学习能力、记忆力和精力都是有限的。没有人能精通所有领域,只能在特定领域深耕。无论是"一万小时定律"还是家庭教育,都在引导我们成为专业人才,本质上是为企业和社会创造更高的运转效率。

随着分工的深化,协作和标准化应运而生,进而催生了自动化系统和工具,这些工具又进一步推动了专业分工和标准化。

但人工智能的发展却开启了一个新的方向。专家们不再满足于专业领域的人工智能,甚至将其贬称为"狭义人工智能"而非"专业人工智能"。他们追求AGI(通用人工智能),希望它能具备通用能力和跨领域的能力融合,从更高、更全面的视角解决广泛问题,适应不同任务,提供全局性的解决方案。

所以,人类向左,AGI向右。

自动化的分叉路口

传统的自动化表面上是为每个人服务,但实质上是为企业和社会效率服务。这种自动化建立在专业分工之上,而如今的AGI则在寻求突破专业分工的界限,追求通用能力。如果我们接受行业的主流观点,AGI将在近几年出现,AI Agent将自动帮助我们完成目标,自主使用工具,快速浏览网页,不知疲倦地收集资料。难道我们人类真的只需要提出要求,然后躺在沙发上等待结果就够了吗?

如果真到了那个时候,我们刚才讨论的社会根基可能就会动摇——企业还需要分部门和专业领域吗?这种变化已经开始显现:专业壁垒正在被打破,小型公司和个人企业不断涌现。如果企业不再需要专业化,教育机构还有必要分专业吗?各种资格认证考试还有存在的必要吗?

如果AGI能胜任各种不同的工作,企业和个人可能不再需要极度专业化,人类也就能重新发展更广泛的创造力。AGI可能将人类从"过度专业化"中解放出来,让我们重新成为"全才"或"无才",至少不会再被局限在单一职业和专业领域中。我们或许该转型为"意义的构建者"或"终极的享乐者"。

目前这种情况尚未出现,主要有两个原因:首先,此轮AI爆发主要影响计算机和互联网领域的自动化,对物理世界的影响相对有限。其次,当前AI的表现水平大约在70-80分,还不足以承担更复杂的任务。虽然人类顶尖专家能达到90分以上的水平,而现实世界中确实存在表现在70-80分甚至60分的从业者(这也是我们常说"世界是个草台班子"的原因),但我们仍然期望能得到90分以上水平的服务。不过,Agent类自动化应用目前主要体现出两个价值:

第一,它能够有效组织和协调70-80分水平的工作,同时让专业工具处理专业事务。Agent主要解决协作问题,包括理解意图、规划任务、协调沟通等。因此,Agent类自动化应用仍然建立在人类既有的分工协作基础之上,并未突破这一框架,而是进一步提升了运转效率。这正是其可行性的关键所在。

第二,人类长期以来在标准化流程中运转。虽然效率很高,但也导致了同质化,而同质化无法带来竞争优势,没有竞争优势就无法获得超额利润——这是迈克尔·波特的基础理论。基于人工智能的Agent能够帮助解决部分个性化需求。

通过这两种方式,我们可以构建出新型的生产结构:以企业原有的专业化、标准化能力为基础,结合Agent自动化带来的高效协作网络,为消费者提供个性化的产品和服务,从而重构企业的成本曲线和效率曲线。

对于个人使用Agent自动化应用,这个问题需要具体分析。如果是进行个人编程开发、内容创作、知识获取等任务,可以将其视为企业级自动化应用的个人版本——你就是这家"公司"的经营者。如果是为家庭或家庭成员服务,也可以参照企业自动化应用的模式,基于现有专业工具提高协作效率,输出个性化服务。至于个人消费、娱乐相关的自动化,同样可以采用这种方式,比如让Agent协助使用订餐应用、选择菜品、付款和下单。

人类与自动化的关系

既然Agent该发挥以上的作用,那么下一个问题就是:我们应该选择全自动化的流程处理,还是需要人参与的半自动化流程?也许你会不假思索地说:"当然是全自动的,这样效率最高,人也最省事。就像我们刚才说的,人类只需要提出目标和要求,然后等着拿结果就行了。"

在AGI的未来尚未可知,但在当今的Agent时代,情况显然不是这样。对于全自动化,我不得不提出以下疑问:

我们真正的个性化需求真的能被人工智能完全自动化处理吗?它真的能理解我们的目标吗?目标在处理过程中是否需要优化调整?中间过程是否需要人工介入来确认?如果出现异常该如何处理?如果中间过程不符合用户要求又该怎么办?

这些疑问来自我多年的自动化实践经验,最近一篇论文更加印证了我的想法——全自动AI并不可靠。这篇论文是《Ironies of Automation》(自动化的反讽),由认知心理学家莉萨娜·贝恩布里奇(Lisanne Bainbridge)于1983年在《自动化》期刊上发表。这篇被引用超过1800次的经典论文被视为对自动化固有问题的开创性论述。其核心观点是:任何自动化系统最终都会演变为"人机协作系统"。即使不断提高自动化水平,"人的因素"仍然至关重要。

为什么人类必须与自动化系统共存,而不能实现完全的自动化?根据论文内容,我总结出四个核心原因。这些问题并非出自AI或自动化系统本身的局限,而是源于人类的固有特性:一是人类难以准确表达目标和问题;二是自动化使人类技能逐渐退化,反过来又阻碍了自动化的进一步发展;三是人类无法有效应对自动化流程中的异常情况;四是人类难以在自动化流程中承担相应责任。

(一)人类不具备提出清晰目标和问题的能力

人类思维的模糊性。人类主要依靠直觉、经验和情感来决策与表达目标,这些内在体验难以用精确的语言描述。我们对目标可能有直观的感觉,但在转换为具体、结构化的指令时,往往会变得模糊或产生歧义。我们并不觉得这是个问题,因为人类大脑擅长处理模糊信息,能通过直觉、经验和社会共识来填补逻辑空白。然而,当我们需要向AI Agent表达要求时,这种模糊性就成了障碍。

一是人类语言本身的局限性。自然语言虽然灵活且富有表现力,但正是这种灵活性导致它常常缺乏精确性和严谨性。在思想转化为语言的过程中会损失信息,因此人类难以将复杂的背景知识和隐含假设完整地传达给AI Agent。这就是为什么传统人机交互要么使用编程等形式化语言,要么通过表单和选项来确保清晰的选择。

二是人类目标和问题本身就存在多层次性与冲突性。人类的目标通常包含多个层次和维度,即使在个人内部也可能存在冲突。比如,追求职业成功和家庭幸福这两个目标有时会相互矛盾。向AI下达指令时,如果没有明确权衡和定义这些层次之间的关系,很容易导致AI对目标的理解不清或优先级混乱。

三是AI与人类认知模型的差异。虽然行业中在讲人类对齐,但是你用的大模型到底和哪个人类做的对齐,和它对齐的人类,能和你对齐吗?例如一些不可通约的价值判断,如何平衡"效用最大化"与"机会平等”?超出线性因果的推理,例如城市交通优化AI若单纯追求通行效率最大化,可能导致区域商业生态失衡。伦理价值冲突,面临电车难题这样的道德困境时,乘客安全,还是行人安全,还是财产损失,每个人的选择都是不同的,人与AI也当然不同。

你可能会说,这些问题在人与人之间的协作中也会出现,比如领导给下属安排工作时的情况就很类似。没错,正因如此,人类在协作过程中需要不断调整目标和处理方式。当领导安排工作时,下属需要复述任务内容并确认自己的理解是否正确,在执行过程中还要在关键节点和产出中间结果时与领导再次确认。从更现实的角度来说,人际协作中还涉及人性的复杂面向:贪婪、多疑与权力欲望。如果连最亲近的人都难以完全信任——"他能处理好吗?会不会犯错?会不会设套?他的能力远不如我,我得去监督"——那么,我们又怎能完全放心地把工作交给AI处理呢?况且,如果完全依赖AI,又如何体现人的价值和主导地位?

你又可能会说,人类历史上已经把许多事情交给机器来做,似乎也没有引起担忧。但这是因为这些自动化机器必须达到100%的准确性和可靠性,而且只有在经过反复验证后,人类才会采用。这些传统的自动化机器与AI不同,它们遵循固定的规则运行,产出结果稳定且可预测。除此之外,在大多数场景中,人类仍然需要亲自操作工具,通过逐步确认来完成任务。而当今的人工智能具有类人特性,既不能保证100%的准确性,也无法保持输出的一致性,更是一个难以理解的黑盒系统。在这种情况下,我们如何能放心让AI完全自动化地处理任务呢?这意味着我们必须持续监控AI系统的运行状况,并在出现错误时及时介入和处理。

(二)人类技能的退化导致不会允许更高水平的自动化

在自动化系统面前,人类的技能(包括认知能力和动手能力)会因长期闲置而逐渐退化。高水平的专业技能通常需要通过频繁、持续的练习来获得和维持。当自动化接管了大部分工作后,操作员的角色往往变成了单纯的监控者,一旦遇到需要人工介入的紧急状况,却因长期缺乏实践而难以应对。

这就产生了一个悖论:自动化水平越高,需要人工处理的突发状况就越罕见、越复杂。反而对操作员提出了更高的要求,因为他们必须能够处理这些更具挑战性的异常事件。

这种技能退化现象不仅体现在动手能力上,也同样适用于认知能力。人类的认知技能需要持续的实践和反馈才能保持敏锐。在系统刚实现自动化时,由于操作员此前积累了大量手动操作经验,他们的技能水平较高。但下一代操作员因缺乏这种日常实践的机会,在面对问题时反应会更迟缓,解决效率也更低。

(三)人类无法解决自动化流程中的异常问题

由于操作员仅需监控罕见的异常情况,他们难以持续保持高度警觉。人类天性只关注常用信息,这就需要依赖自动报警系统来提醒异常状况。然而,这又引发了新的问题:系统越复杂,需要的警报就越多,而警报数量越多,紧急情况发生时就越容易陷入混乱。

人们选择自动化是因为相信机器能比人类表现得更好。但当机器出现错误时,却需要人类来发现和纠正这些错误。

当决策完全交由AI负责时,意味着AI可以更快决策、考虑更多因素、使用更精确的标准。这导致人类无法实时判断机器决策的正确性,只能在更高层面上评估决策是否"可接受"。但如果使用机器的原因本就是人类判断力不足,那么人类又如何能够评判机器决策的优劣呢?这是一个本质上无法解决的矛盾。

此外,自动化系统在自我纠错和调整过程中,可能掩盖潜在问题。当自动化达到极限时,这些被掩盖的问题一旦暴露,往往已经难以挽回。

因此,如果要让人类作为自动化系统的后备保障,就必须确保自动化的运行节奏与人类的处理能力相匹配。这就是为什么即便是最先进的自动化工厂,仍然需要人工参与,而且要求人的工作节奏与机器同步——这在流水线领域被称为"节拍"。关于节拍的具体含义,感兴趣的读者可以自行了解。

如果要求人类操作员实时监控机器决策,那么机器的决策方法、标准和速度都必须在人类可理解和跟踪的范围内,即使这样的方式在技术上并非最高效。否则,当操作员对机器决策产生怀疑时,将难以追踪具体的决策步骤,无法找出问题所在。

因此,自动化系统出现问题时的最佳处理流程是:停机→观察→理解→修正→重新启动。然而,某些系统(如核电厂或飞行中的飞机)无法随时停机处理故障。对于缓慢发生的故障,操作员可以通过训练好的快速反应争取时间;但对于那些发生速度超出人类反应能力的故障,就必须依靠自动化系统本身做出可靠响应。如果无法保证这一点,或故障后果过于严重,就不应开发这类系统。

(四)人类无法在自动化流程中担负责任

当系统需要考虑效率之外的因素,如公众和消费者对完全自动化AI系统的接受度时,人类就必须参与其中。因此,人类与自动化系统需要以"团队合作"的方式运作。

然而,这种合作也存在隐患:究竟是人类调度AI,还是AI调度人类?如果由AI来调度人类,为操作员列出建议的行动步骤,而操作员又完全信任这些建议,那么不如直接让计算机自动执行这些步骤,而不是让人类机械地完成它们。

在没有时间压力的情况下,人类擅长解决复杂问题。但讽刺的是,一旦面临时间压力,人类的表现就会显著下降。因此,自动化并非万能解决方案。相反,要妥善应对自动化带来的新问题,可能需要AI提供更先进、更智能的任务分配方式。

Agent发展方向

通过以上分析,我们可以得出一下基本结论:即使自动化能力再强,也需要人类的配合使用,无法实现人们理想中完全无人参与的全自动化。

在实现AI自动化时,不宜过于追求通用领域,因为通用领域的目标和知识很难与用户对齐。更适合的方向是专注于垂直领域,这样可以设定明确的约束条件,并充分利用行业专业知识。目前成功的AI应用大多集中在特定场景,如Cursor的编程、Deep Research和Storm的研究报告写作。相比之下,Manus主打"通用"的路线,在具体场景中反而难以优化,既难以满足用户需求,也难以培养用户习惯,根本原因在于缺乏明确的问题解决方案。

当前这些Agent能完成的任务,如开发小游戏、建设网站、搜索资料等,本质上都是面向个人用户的简单任务。一旦涉及企业级应用或更复杂的任务,AI自动化就显得力不从心。

在个人消费领域的自动化场景中,大多数任务本身并不复杂,人工处理也较为简单。这类任务往往具有强烈的个性化特征,充满主观性和不确定性。在这种情况下,由个人直接判断和处理反而更为合适。况且,个人用户向AI发起的任务往往目标模糊,缺乏严谨性。稍有复杂,AI就难以准确理解和执行。如果用户还需要不断调整和修改,反而会耗费更多时间和精力。

既然人类无法完全脱离AI自动化系统,那么我们应该如何与AI展开有效协作呢?

理想中的人机协作

什么是人机结合?在专业领域中,这被称为Human in the Loop(人在回路中),指在自动化流程中加入人类参与的环节。在这种理想模式下,系统会对每个步骤进行验证,一旦发现问题,可以立即回到之前的节点,让AI重新处理或由人类介入解决。这种方式与Manus采用的一次性完成模式形成了鲜明对比。

最近我发现了一款体现这种理念的AI产品——Flowith。它突破传统的对话式线性交互,采用画布式创作平台,让操作体验如同在白板上书写般直观。用户可以创建多个AI交互节点,每个节点代表不同的问题、主题或子任务,并将它们连接成思维网络。该平台支持本地知识库,能同时处理多个任务。

在Flowith的Oracle"先知功能"中,用户不再是被动旁观者,而是成为HITL(Human in the Loop)的主导者,可以实时参与AI的创作过程。Oracle设计完整套Recipe后会先征求用户确认,用户可以调整步骤顺序、删改内容或增加新步骤。若对结果不满意,Oracle会生成更多步骤以满足需求。每完成一步,Oracle都会根据执行结果更新整个Recipe——例如,当发现搜索信息不足时,它会在后续步骤中补充搜索,确保任务顺利完成。这样便形成了一个将AI输出与人类操作完美结合的画布交互式Agent系统。

HITL在AI Agent应用中有多种实现形式,这与Copilot模式有所不同。Copilot模式中,人类是主驾驶,在适当时机使用AI作为副驾驶。而在HITL中,以AI的自动化处理为主,人类则更像副驾驶。

HITL主要包括以下形式:

  • 人类监督(Human Oversight):AI在决策前后由人类进行审查、确认或修正,虽然效率较低;
  • 人类增强(Human Augmentation):AI仅作为辅助提供方案,需要人类完善和确认后才能执行。主要难点在于人类需要理解AI提供的方案;
  • 人类-AI团队协作(Human-AI Teaming):任务在人类和AI之间灵活分配,双方可以互相分派工作。这种模式的关键在于任务分配的平衡——分配给人类太多会降低效率,给AI太多则可能缺乏可控性;
  • 人类介入者(Human Intervener):AI独立运行,人类不进行实时监控但可在关键决策点介入控制。主要挑战在于如何在AI高速处理过程中实现有效介入,以及如何在介入后保持自动化流程的连续性;

尽管这些方式都面临各自的挑战,但这些问题都是可以克服的。随着大模型能力的提升,我们相信未来会出现更多优秀的AI产品,在处理效果、人机交互、运行效率和用户体验等方面达到良好的平衡。

综述

结尾,再让我们总结本文的主要内容和观点:

回顾历史,传统自动化是工业革命的副产品,源于专业化分工。而今天的AI自动化可能打破这一格局——如果实现,将颠覆整个社会形态。目前的AI agent自动化结合了现有的组织模式、劳动力形态和IT工具,相比传统自动化增添了两大核心能力:组织AI工作和提供个性化服务。虽然仍然依附于旧有价值体系,但这种创新确实具有重要价值。

然而,这种价值不应被过分夸大。我们讨论了为什么像Manus这样追求通用全自动化的方向并不可取,而专业领域中人机协同的自动化才更有意义。即使在高级智能流程自动化中,人类参与仍然不可或缺。这主要是因为:用户往往难以明确目标、人类技能可能退化、无法有效监控和处理AI自动化的异常情况。此外,过度依赖全自动处理——特别是考虑到当今AI的黑盒特性和结果不确定性——人类将难以对结果负责。

因此,我们需要让人类参与AI自动化流程。我们探讨了类似Flowith Oracle这样的人机协作模式,以及其他可能的协作形式。但每种模式都面临着各自的挑战需要解决。

在我们的讨论中充满了各种悖论:

  • 人类原本的自动化表面上是为每个人服务,但实际上是为企业和社会效率服务;
  • 传统的自动化建立在专业分工之上,而如今的AGI却在寻求突破专业分工的通用能力;
  • 我们最热衷追求的是完全无需人类介入的全自动化系统,希望能做个甩手掌柜,但讽刺的是,自动化流程恰恰离不开人类参与;
  • AI agent的短期发展需求与AGI的长期愿景之间也存在矛盾。

人类总是追求难以企及的目标,而眼前的现实又常常与期望相去甚远。这与法国作家加缪(Albert Camus)在《鼠疫》和《西西弗的神话》中阐述的"荒诞哲学"(Philosophie de l'absurde)不谋而合。他指出人类的追求与现实世界的冷漠本质之间存在着无法跨越的鸿沟。这就是"荒诞悖论"的核心:人类渴望寻找生命的意义,但世界本身并未赋予任何既定意义。虽然这种荒诞感让人觉得理想永远无法完全实现,但这并不意味着追求本身毫无价值——关键在于在追寻的过程中创造属于自己的意义。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询