推荐语
探索云端机器人Manus的创新架构与工作流程。
核心内容:
1. Manus的“大脑、双手、工作台”架构设计
2. 模拟人类实习生的工作流程
3. 核心技术亮点:“手脑并用”的直接成果输出
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
一、Manus 的整体架构
Manus 的架构可以类比为 “一个会思考的云端机器人”,它由 大脑(模型层)、双手(工具层) 和 工作台(执行环境) 三部分组成:
1. 大脑(模型层)
- 功能:负责理解用户指令、规划任务步骤、监控执行过程。
- 技术实现:
- (1)基于多个大模型(如 Claude 3.5 和 Qwen)协同工作,模型间分工明确:
- 规划模型:拆解任务(如将“写旅行攻略”分解为查机票、选酒店、排行程);
- 执行模型:调用工具(如浏览器搜索、编写代码、生成文档);
- 审核模型:校验结果(如检查酒店价格是否合理)。
- (2)动态学习:根据用户反馈调整执行策略(例如用户常选择经济型酒店,后续推荐优先考虑性价比)。
2. 双手(工具层)
- 功能:提供执行任务所需的工具,如浏览器、代码编辑器、文件管理器。
- 技术实现:
- (1)内置工具链:集成 Python 解释器、网页爬虫、Office 接口,可直接操作文件和数据;
- (2)私有 API 接入:例如调用航班查询接口获取实时票价,或连接企业内部数据库提取客户信息。
3. 工作台(执行环境)
- 功能:提供安全的云端环境,隔离不同任务以避免干扰。
- 技术实现:
- (1)虚拟机隔离:每个任务运行在独立的云端虚拟机中,防止数据泄露; (2)权限控制:根据任务需求动态分配权限(如仅允许读取指定文件夹)。
二、Manus 的工作原理
Manus 的工作流程类似 “人类实习生”,分为 理解任务→拆解步骤→执行操作→反馈结果 四个阶段:
1. 理解任务
- 案例:用户输入“帮我筛选出10份适合算法工程师的简历”。
- 原理:
- 模型分析关键词(“算法工程师”),识别隐含需求(如要求编程能力、项目经验);
- 通过 上下文理解 确认细节(如是否需要排除应届生)。
2. 拆解步骤
- 案例:任务拆解为:解压文件→逐份阅读→提取技能关键词→评分排序。
- 原理:
- Agent Base 系统:将任务分解为子任务树,每个子任务由不同模型或工具处理;
- MCP 协议:协调子任务间的依赖关系(如必须先解压文件才能读取简历)。
3. 执行操作
- 案例:自动调用 Python 脚本解压文件,用浏览器插件抓取 LinkedIn 信息。
- 原理:
- 工具调用:模型生成代码
unzip resumes.zip
并执行,若出错则触发重试; - 异步执行:任务在云端独立运行,用户可关闭页面,完成后通过邮件通知。
4. 反馈结果
- 案例:生成 Excel 表格,包含候选人排名、技能匹配度、推荐理由。
- 原理:
- 多模态输出:结合文本、图表、链接(如 GitHub 项目);
- 审核机制:审核模型检查逻辑错误(如将“3年经验”误判为“5年”)。
三、Manus 的核心技术亮点
1. “手脑并用”设计
- 传统 AI:只能生成建议(如“您应该筛选有 Python 经验的简历”)。
- Manus:直接输出成果(如一份带评分的简历表格),相当于 “思考+动手” 结合。
2. 动态学习能力
- 案例:用户多次修改生成的 PPT 配色后,Manus 自动记住偏好,后续默认使用深蓝色主题。
- 原理:通过 AHPU 指标(用户使用 Agent 的小时数)优化模型,而非单纯增加用户数。
3. 安全与效率平衡
- 虚拟机隔离:即使任务出错(如爬虫被封 IP),也不会影响其他任务;
- 成本控制:单次任务消耗约 2 美元,仅为 GPT-4 同类任务的 1/5。
四、与普通大模型的本质区别
对比项 | Manus | 普通大模型(如 GPT-4) |
任务范围 | 端到端闭环(从指令到交付成果) | 仅提供建议或代码片段 |
执行环境 | 云端虚拟机(自带浏览器、编辑器) | 依赖用户本地环境 |
交互模式 | 异步执行(可离线等待) | 同步交互(需保持在线) |
学习方式 | 动态适应用户习惯(如偏好、常用工具) | 静态输出(无法记忆用户历史) |
五、典型应用场景
1. 简历筛选
- 流程:上传压缩包→自动解压→提取技能关键词→生成排名表→推荐面试问题。
- 优势:HR 节省 80% 时间,避免手动筛选遗漏人才。
2. 旅行规划
- 流程:输入“4 月日本赏樱+预算 1 万”→自动查询机票酒店→生成行程 PDF→预订链接汇总。
- 优势:用户无需切换多个 App 比价。
六、争议与局限性
- 技术透明度低:未公开技术文档,被质疑依赖现有模型(如 Claude)而非原创。
- 任务复杂度限制:无法处理需跨平台深度交互的任务(如自动安装 Steam 游戏)。
- 过度营销风险:部分演示视频可能剪辑优化,实际效果存在落差。
Manus 的架构设计使其更像一个 “会自主工作的数字员工”,而非传统对话式 AI。它的价值在于 降低专业门槛(普通人也能完成复杂任务)和 提升效率(从“动口”到“动手”),但技术成熟度仍需验证。对于普通用户,可优先尝试明确需求的任务(如数据分析),而复杂场景建议保持人工复核。