我要投稿

揭秘Manus：了解其背后的原理与架构

发布日期：2025-04-23 14:41:33 浏览次数： 1541 作者：硅基蒸馏

一、Manus 的整体架构

Manus 的架构可以类比为 “一个会思考的云端机器人”，它由 大脑（模型层）、双手（工具层） 和 工作台（执行环境） 三部分组成：

1. 大脑（模型层）

功能：负责理解用户指令、规划任务步骤、监控执行过程。
技术实现：

（1）基于多个大模型（如 Claude 3.5 和 Qwen）协同工作，模型间分工明确：

规划模型：拆解任务（如将“写旅行攻略”分解为查机票、选酒店、排行程）；
执行模型：调用工具（如浏览器搜索、编写代码、生成文档）；
审核模型：校验结果（如检查酒店价格是否合理）。

（2）动态学习：根据用户反馈调整执行策略（例如用户常选择经济型酒店，后续推荐优先考虑性价比）。

2. 双手（工具层）

功能：提供执行任务所需的工具，如浏览器、代码编辑器、文件管理器。
技术实现：

（1）内置工具链：集成 Python 解释器、网页爬虫、Office 接口，可直接操作文件和数据；
（2）私有 API 接入：例如调用航班查询接口获取实时票价，或连接企业内部数据库提取客户信息。

3. 工作台（执行环境）

功能：提供安全的云端环境，隔离不同任务以避免干扰。
技术实现：

（1）虚拟机隔离：每个任务运行在独立的云端虚拟机中，防止数据泄露；（2）权限控制：根据任务需求动态分配权限（如仅允许读取指定文件夹）。

二、Manus 的工作原理

Manus 的工作流程类似 “人类实习生”，分为 理解任务→拆解步骤→执行操作→反馈结果 四个阶段：

1. 理解任务

案例：用户输入“帮我筛选出10份适合算法工程师的简历”。
原理：

模型分析关键词（“算法工程师”），识别隐含需求（如要求编程能力、项目经验）；
通过 上下文理解 确认细节（如是否需要排除应届生）。

2. 拆解步骤

案例：任务拆解为：解压文件→逐份阅读→提取技能关键词→评分排序。
原理：

Agent Base 系统：将任务分解为子任务树，每个子任务由不同模型或工具处理；
MCP 协议：协调子任务间的依赖关系（如必须先解压文件才能读取简历）。

3. 执行操作

案例：自动调用 Python 脚本解压文件，用浏览器插件抓取 LinkedIn 信息。
原理：

工具调用：模型生成代码 unzip resumes.zip 并执行，若出错则触发重试；
异步执行：任务在云端独立运行，用户可关闭页面，完成后通过邮件通知。

4. 反馈结果

案例：生成 Excel 表格，包含候选人排名、技能匹配度、推荐理由。
原理：

多模态输出：结合文本、图表、链接（如 GitHub 项目）；

审核机制：审核模型检查逻辑错误（如将“3年经验”误判为“5年”）。

三、Manus 的核心技术亮点

1. “手脑并用”设计

传统 AI：只能生成建议（如“您应该筛选有 Python 经验的简历”）。
Manus：直接输出成果（如一份带评分的简历表格），相当于 “思考+动手” 结合。

2. 动态学习能力

案例：用户多次修改生成的 PPT 配色后，Manus 自动记住偏好，后续默认使用深蓝色主题。
原理：通过 AHPU 指标（用户使用 Agent 的小时数）优化模型，而非单纯增加用户数。

3. 安全与效率平衡

虚拟机隔离：即使任务出错（如爬虫被封 IP），也不会影响其他任务；
成本控制：单次任务消耗约 2 美元，仅为 GPT-4 同类任务的 1/5。

四、与普通大模型的本质区别

对比项	Manus	普通大模型（如 GPT-4）
任务范围	端到端闭环（从指令到交付成果）	仅提供建议或代码片段
执行环境	云端虚拟机（自带浏览器、编辑器）	依赖用户本地环境
交互模式	异步执行（可离线等待）	同步交互（需保持在线）
学习方式	动态适应用户习惯（如偏好、常用工具）	静态输出（无法记忆用户历史）

五、典型应用场景

1. 简历筛选

流程：上传压缩包→自动解压→提取技能关键词→生成排名表→推荐面试问题。
优势：HR 节省 80% 时间，避免手动筛选遗漏人才。

2. 旅行规划

流程：输入“4 月日本赏樱+预算 1 万”→自动查询机票酒店→生成行程 PDF→预订链接汇总。
优势：用户无需切换多个 App 比价。

六、争议与局限性

技术透明度低：未公开技术文档，被质疑依赖现有模型（如 Claude）而非原创。
任务复杂度限制：无法处理需跨平台深度交互的任务（如自动安装 Steam 游戏）。
过度营销风险：部分演示视频可能剪辑优化，实际效果存在落差。

Manus 的架构设计使其更像一个 “会自主工作的数字员工”，而非传统对话式 AI。它的价值在于降低专业门槛（普通人也能完成复杂任务）和提升效率（从“动口”到“动手”），但技术成熟度仍需验证。对于普通用户，可优先尝试明确需求的任务（如数据分析），而复杂场景建议保持人工复核。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-23

2025：LLM 超越 “Token 生成器” 的一年

2025-04-23

DeepSeek助力企业变革核心业务？这8个案例太经典了

2025-04-23

万字解读AI落地本质：To B才是AI主战场

2025-04-23

一家小VC眼中的：AI投资指北

2025-04-23

周飞：能源电力大模型的研发路径与应用模式探讨

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

AI 能陪你亲亲热热，多亏了“存储硬汉”输出狠活儿！

2025-04-23

AI Agent 的下半场：从token生成到自主体验

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

从“大模型热”到“Agent 潮”，“真风口”还是“伪命题”？

2025-04-21

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部