微信扫码
添加专属顾问
我要投稿
Manus AI的革命性创新,重新定义智能助手的产品化趋势。核心内容:1. Manus AI的多领域任务处理能力和高效工作输出2. 与传统智能体相比,Manus的创新点和成本优势3. OpenAI的应对策略与新发布的开发工具能力套件
当AI从"嘴强王者"变身"执行狂魔",在Manus爆火一个星期之后,我们还是要认真思考这个产品带给AI行业发展路径的启发。
Manus的出圈,有多重因素的必然性。它像一位不知疲倦的"数字管家",能同时处理简历筛选、股票分析、旅行规划等跨领域任务,甚至在用户睡觉时完成三天的工作量。
经过这一周多,各种理念层面的解读或者说误伤已经很多。包括说Manus是套壳,只不过是使用了Claude的高级API能力,或者说邀请码是在搞营销的炒作等等。
但这都不妨碍Manus确实有足够牛逼的创新。
1. 精彩的交付结果,相比于传统智能体的文本交付,Manus直接给到超炫酷的网页展示;
2. 执行过程的极度透明,尽管你没有邀请码,但依然可以通过“回放功能”感受AI执行的全链路;
3. 成本真的拉得很低,相比于OpenAI的200美金/月的订阅,Manus单次任务执行只需要2美金成本。
其实最被打脸/最受伤的还是OpenAI。
当OpenAI发布了o1慢思考模型,却并没有对世界开放思考过程;结果DeepSeek的深度思考“嗯,用户让我...”取而代之;
当OpenAI发布了Operator和DeepResearch的超级Agent,却仅对200美金/月的付费用户开放;结果Manus通过“回放功能”的传播取而代之;
免费+好的产品体验+可传播性,能碾压看似高大上的一切。
这个道理一直没变过。真是有因,有果。
这两天还有一篇Github上越狱出来的【Manus Tools and Prompts】的内容,我建议要仔细看,能明白很多其背后的运作逻辑。截取一些很关键的信息如下:
—— 这定义了Manus为何而存在,就是要收集信息,创造内容,解决问题。
—— 这是圈定了Manus的技能和工具范围,说白了就是Manus究竟能干什么。
—— 这解释了Manus是一个多Agent系统,要组合起来各种Agent和上述提到的Tool能力,彻底完成用户布置的任务并提交成果。
—— 这解释了Manus在执行任务的时候,会分别有一系列特殊固定的能力模块。
—— 这表明Manus也有能力使用的规范和约束,还包括browser rules、coding rules、info rules等等。
因此昨天OpenAI终于也坐不住了,一下子对开发者发布了“3+2”套件的开发工具能力。
其中3是三个很关键的高级Agent工具能力:
另外的2是两个对话反馈模式的高级整合:
Response API:从原来的只能对话聊天的能力,升级为可以对话+执行+搜索等组合
Agent SDK:从单一Agent完成任务,升级为可以调动多个Agent协同完成任务
OpenAI这次应该不是2月份被DeepSeek捅破天时候的被逼无奈,而是有所遇见。
所以他们不停的在强调,2025年是Agent之年,the year of Agent。
我们要问,为什么?
这时候就要回过头来看Manus是怎么工作的。
Manus的变革,超过我们一直使用的传统AI助手,是个只会念菜谱的学徒——你问"糖醋排骨怎么做",它能背出步骤,但不会开火、不会切肉。
而Manus则像一位米其林主厨,接到"准备八人宴席"的指令后,能自动买菜、调配灶具、掌控火候,最后端出色香味俱全的菜肴。
这种质变源于三大核心设计:
1. "三脑协同"的智能中枢(Multi-Agent Collaboration)
"指挥家"规划脑(Planning Agent):像交响乐指挥,用蒙特卡洛树搜索算法(类似围棋AI的决策方式)动态拆解任务。比如处理100份简历时,它会先扫描文件结构,像主厨根据食材库存调整菜单:优先筛选学历匹配的候选人,再分析工作经验,最后生成报告。
"工匠"执行脑(Execution Agent):整合200+工具接口,如同厨房里的刀具库。它能模拟人类操作浏览器点击、滚动,自动调用Excel生成图表,甚至用Python编写数据分析代码。就像主厨同时操控炒锅、烤箱和搅拌机,让锅铲和键盘都成为"手指"的延伸。
"质检员"验证脑(Validation Agent):通过对抗性测试模块把关质量。例如分析财报时,若数据与行业基准偏差超5%,会像食品安全检测仪一样触发复核流程。这种"三重签名"机制(三个模型独立计算后交叉验证)确保结果可靠,避免端出半生不熟的菜品。
2. "动态菜谱"进化系统
传统AI的"菜谱"是固定的,而Manus支持实时反馈迭代。用户可随时修正输出格式(比如指定PPT模板),就像食客要求"少盐多辣",主厨会立即调整配方并记住偏好。即使任务中途崩溃(好比炒菜时停电),它也能像智能冰箱保存进度,用替代方案(如改用关键词匹配继续筛选简历)完成烹饪。
3. "无菌厨房"安全机制
通过浏览器沙箱技术隔离操作,如同在封闭实验室处理食材,避免隐私数据泄露。记忆偏好系统则像私人管家,持续学习用户习惯(比如合同模板风格),在云端构建个性化策略库。
好,说的有点装B。
简单的说,Manus是把市面上能拿到可以付费/免费使用的优秀API工具,有机的组合在一起运作,每个单点的能力都不是我的,但组合起来就是Manus的神奇牛逼之处。
当传统模型巨头还在持续打造"更大参数/推理能力的模型”自产自用的时候,Manus团队选择成为"瑞士军刀工匠"。通过工程化组合多种模型工具的方式核心解决了三个问题:
1. 工具适配:就像让一个厨师能熟练使用所有品牌的厨具,Manus为浏览器、Office等软件开发专用驱动,甚至能操作没有开放API的传统程序。
2. 长线任务管理:传统AI像快餐厨师,必须用户盯着才能工作。而Manus支持异步工作机制,如同慢炖锅能离火后继续焖煮,实现"用户睡觉→AI加班"的颠覆体验。
3. 跨界味觉融合:微软Copilot等产品专注"西餐"(Office场景),Manus却能同时处理"中餐"(简历筛选)和"法餐"(股票分析),突破垂直领域限制。
Manus能整合,其他人就都可以整合。
当最基础的一批模型能力供给达成行业共识,当这批模型的能力边界逐渐被看清楚,就是上层应用的舞台。
但是,Manus是不是真的能像他们所定义的,称为“通用Agent”?
这里有个悖论。
假如是的,那还需要其他Agent什么事儿?又何来Agent的应用之年?
如果使用同样模型的API能力,同样的组合方式和工程效果,Manus1和Manus2又有什么差别呢?
答案很明显。
我的观点是:模型可以通用,但Agent产品还是要百花齐放。
在不同垂直行业,面向不同的用户群体,做不同的体验流程设计。
Manus不是终结者,而是新起点。
尽管在GAIA基准测试中接近人类水平(三级测试达86.5%/70.1%/57.7%),Manus仍面临挑战,也是所有各种Agent产品都会面临的通用问题:
1. 模型API能力的局限性:部分操作依赖浏览器环境,如同只能用特定刀具切菜
2. 稳定性和幻觉:偶发崩溃时可能生成虚假结果,只要某个API的稳定性不是100%,越多的API组合在一起出错的概率就会无限放大
3. 商业模式的不确定:是按需使用还是订阅使用,这两个问题可能在很长一段时间内,都会因为问题1和2的未解决,而无法达成稳定的用户付费意愿
但我们依然要充分肯定Manus的价值。
正如蒸汽机曾漏气、电脑曾死机,每一次技术突破都伴随迭代阵痛。Manus的价值在于证明了:当AI突破"纸上谈兵"阶段,真正成为"手脑并用"的执行者,人机协作将进入前所未有的深度。
当Agent应用之年,可以有更多团队继承这种"手脑并用"的哲学,或许我们距离那个"动动嘴就能改变世界"的未来,真的不再遥远。
=======================
公众号:林夕槽语。作者林一夕,有15年丰富的IT大厂职场经历,经历过移动互联网、区块链、在线教育、AI四轮行业周期,每一次都踩在了风口点上。2024年初开始写作本公众号,专注AI、科技、教育等话题,欢迎关注和交流。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-18
2025-03-18
2025-03-18
2025-03-18
2025-03-18
2025-03-18
2025-03-17
2025-03-17