我要投稿

从越狱Manus的Prompt内容，思考Agent的产品化趋势

发布日期：2025-03-19 04:33:24 浏览次数： 1920 作者：林夕槽语

当AI从"嘴强王者"变身"执行狂魔"，在Manus爆火一个星期之后，我们还是要认真思考这个产品带给AI行业发展路径的启发。

Manus的出圈，有多重因素的必然性。它像一位不知疲倦的"数字管家"，能同时处理简历筛选、股票分析、旅行规划等跨领域任务，甚至在用户睡觉时完成三天的工作量。

经过这一周多，各种理念层面的解读或者说误伤已经很多。包括说Manus是套壳，只不过是使用了Claude的高级API能力，或者说邀请码是在搞营销的炒作等等。

但这都不妨碍Manus确实有足够牛逼的创新。

1. 精彩的交付结果，相比于传统智能体的文本交付，Manus直接给到超炫酷的网页展示；

2. 执行过程的极度透明，尽管你没有邀请码，但依然可以通过“回放功能”感受AI执行的全链路；

3. 成本真的拉得很低，相比于OpenAI的200美金/月的订阅，Manus单次任务执行只需要2美金成本。

其实最被打脸/最受伤的还是OpenAI。

当OpenAI发布了o1慢思考模型，却并没有对世界开放思考过程；结果DeepSeek的深度思考“嗯，用户让我...”取而代之；

当OpenAI发布了Operator和DeepResearch的超级Agent，却仅对200美金/月的付费用户开放；结果Manus通过“回放功能”的传播取而代之；

免费+好的产品体验+可传播性，能碾压看似高大上的一切。

这个道理一直没变过。真是有因，有果。

这两天还有一篇Github上越狱出来的【Manus Tools and Prompts】的内容，我建议要仔细看，能明白很多其背后的运作逻辑。截取一些很关键的信息如下：

—— 这定义了Manus为何而存在，就是要收集信息，创造内容，解决问题。

—— 这是圈定了Manus的技能和工具范围，说白了就是Manus究竟能干什么。

—— 这解释了Manus是一个多Agent系统，要组合起来各种Agent和上述提到的Tool能力，彻底完成用户布置的任务并提交成果。

—— 这解释了Manus在执行任务的时候，会分别有一系列特殊固定的能力模块。

—— 这表明Manus也有能力使用的规范和约束，还包括browser rules、coding rules、info rules等等。

因此昨天OpenAI终于也坐不住了，一下子对开发者发布了“3+2”套件的开发工具能力。

其中3是三个很关键的高级Agent工具能力：

Web Search：网页搜索能力的开放
File Search：文件和私域数据搜索能力的开放
Computer Use Agent：就是可以在云侧自己浏览网页找信息

另外的2是两个对话反馈模式的高级整合：

Response API：从原来的只能对话聊天的能力，升级为可以对话+执行+搜索等组合
Agent SDK：从单一Agent完成任务，升级为可以调动多个Agent协同完成任务

OpenAI这次应该不是2月份被DeepSeek捅破天时候的被逼无奈，而是有所遇见。

所以他们不停的在强调，2025年是Agent之年，the year of Agent。

我们要问，为什么？

这时候就要回过头来看Manus是怎么工作的。

Manus的变革，超过我们一直使用的传统AI助手，是个只会念菜谱的学徒——你问"糖醋排骨怎么做"，它能背出步骤，但不会开火、不会切肉。

而Manus则像一位米其林主厨，接到"准备八人宴席"的指令后，能自动买菜、调配灶具、掌控火候，最后端出色香味俱全的菜肴。

这种质变源于三大核心设计：

1. "三脑协同"的智能中枢（Multi-Agent Collaboration）

"指挥家"规划脑（Planning Agent）：像交响乐指挥，用蒙特卡洛树搜索算法（类似围棋AI的决策方式）动态拆解任务。比如处理100份简历时，它会先扫描文件结构，像主厨根据食材库存调整菜单：优先筛选学历匹配的候选人，再分析工作经验，最后生成报告。

"工匠"执行脑（Execution Agent）：整合200+工具接口，如同厨房里的刀具库。它能模拟人类操作浏览器点击、滚动，自动调用Excel生成图表，甚至用Python编写数据分析代码。就像主厨同时操控炒锅、烤箱和搅拌机，让锅铲和键盘都成为"手指"的延伸。

"质检员"验证脑（Validation Agent）：通过对抗性测试模块把关质量。例如分析财报时，若数据与行业基准偏差超5%，会像食品安全检测仪一样触发复核流程。这种"三重签名"机制（三个模型独立计算后交叉验证）确保结果可靠，避免端出半生不熟的菜品。

2. "动态菜谱"进化系统

传统AI的"菜谱"是固定的，而Manus支持实时反馈迭代。用户可随时修正输出格式（比如指定PPT模板），就像食客要求"少盐多辣"，主厨会立即调整配方并记住偏好。即使任务中途崩溃（好比炒菜时停电），它也能像智能冰箱保存进度，用替代方案（如改用关键词匹配继续筛选简历）完成烹饪。

3. "无菌厨房"安全机制

通过浏览器沙箱技术隔离操作，如同在封闭实验室处理食材，避免隐私数据泄露。记忆偏好系统则像私人管家，持续学习用户习惯（比如合同模板风格），在云端构建个性化策略库。

好，说的有点装B。

简单的说，Manus是把市面上能拿到可以付费/免费使用的优秀API工具，有机的组合在一起运作，每个单点的能力都不是我的，但组合起来就是Manus的神奇牛逼之处。

当传统模型巨头还在持续打造"更大参数/推理能力的模型”自产自用的时候，Manus团队选择成为"瑞士军刀工匠"。通过工程化组合多种模型工具的方式核心解决了三个问题：

1. 工具适配：就像让一个厨师能熟练使用所有品牌的厨具，Manus为浏览器、Office等软件开发专用驱动，甚至能操作没有开放API的传统程序。

2. 长线任务管理：传统AI像快餐厨师，必须用户盯着才能工作。而Manus支持异步工作机制，如同慢炖锅能离火后继续焖煮，实现"用户睡觉→AI加班"的颠覆体验。

3. 跨界味觉融合：微软Copilot等产品专注"西餐"（Office场景），Manus却能同时处理"中餐"（简历筛选）和"法餐"（股票分析），突破垂直领域限制。

Manus能整合，其他人就都可以整合。

当最基础的一批模型能力供给达成行业共识，当这批模型的能力边界逐渐被看清楚，就是上层应用的舞台。

但是，Manus是不是真的能像他们所定义的，称为“通用Agent”？

这里有个悖论。

假如是的，那还需要其他Agent什么事儿？又何来Agent的应用之年？

如果使用同样模型的API能力，同样的组合方式和工程效果，Manus1和Manus2又有什么差别呢？

答案很明显。

我的观点是：模型可以通用，但Agent产品还是要百花齐放。

在不同垂直行业，面向不同的用户群体，做不同的体验流程设计。

Manus不是终结者，而是新起点。

尽管在GAIA基准测试中接近人类水平（三级测试达86.5%/70.1%/57.7%），Manus仍面临挑战，也是所有各种Agent产品都会面临的通用问题：

1. 模型API能力的局限性：部分操作依赖浏览器环境，如同只能用特定刀具切菜

2. 稳定性和幻觉：偶发崩溃时可能生成虚假结果，只要某个API的稳定性不是100%，越多的API组合在一起出错的概率就会无限放大

3. 商业模式的不确定：是按需使用还是订阅使用，这两个问题可能在很长一段时间内，都会因为问题1和2的未解决，而无法达成稳定的用户付费意愿

但我们依然要充分肯定Manus的价值。

正如蒸汽机曾漏气、电脑曾死机，每一次技术突破都伴随迭代阵痛。Manus的价值在于证明了：当AI突破"纸上谈兵"阶段，真正成为"手脑并用"的执行者，人机协作将进入前所未有的深度。

当Agent应用之年，可以有更多团队继承这种"手脑并用"的哲学，或许我们距离那个"动动嘴就能改变世界"的未来，真的不再遥远。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-16

Altman 正在悄悄打造“AI版X”？ChatGPT社交功能曝光

2025-04-16

微软AI核心战略解密：让OpenAI冲锋陷阵当炮灰，采用跟随者策略坐收技术红利

2025-04-16

Claude 推出高级 Research 功能，并深度集成 Google Workspace

2025-04-16

智能体工作流与设计模式解析

2025-04-16

GPT-4.1一手实测，实力绝对被低估了

2025-04-16

这些你不知道的 OpenAI 4.1 秘密

2025-04-15

前沿导读 | 大模型智能体驱动的社会仿真

2025-04-15

Gemini 2.5 Pro 暴击 OpenAI，性能猛兽不翻车，全球顶尖实至名归

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

2025-04-13

有了MCP，还需要深入研究Agent吗？

2025-04-13

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

谁是MCP 的 AI 好搭档？

2025-04-11

大模型如何保证输出json格式？

2025-04-11

阿里百炼MCP一键部署简单到颠覆想象！字节Coze会否闪电跟进？

2025-04-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB