微信扫码
添加专属顾问
我要投稿
首款通用Agent Manus工作流深度解析,一文带你领略前沿AI技术。 核心内容: 1. 通用Agent Manus的前沿特性与应用场景 2. Workflow:任务规划与md文件管理的独特结合 3. 从技术层面深入分析Manus的创新与应用实例
昨晚全球首个通用Agent Manus预览版正式发布,其官方展示的效果令人惊叹,展现了强大的任务规划与执行能力。目前还没拿到邀请码,以下是通过对官方网站案例的拆解, 以下将从workflow,memory和前端交互三个方面进行拆解,总的来说就是整合了 computer use、deep research、coding agent等概念的产物。
“Manus 都能通过独立思考和系统规划,在自己的虚拟环境中灵活调用各类工具——编写并执行代码、智能浏览网页、操作各类网页应用——为你直接交付完整的任务成果,而非仅仅提供建议或答案。”
todo.md示例
# 日本旅行计划清单
## 研究日本旅行基础知识
- [x] 创建项目目录结构
- [ ] 研究最佳交通选择(JR Pass、当地交通)
- [ ] 研究四月份的天气
- [ ] 检查美国公民的签证要求
- [ ] 研究货币兑换和预算分配
- [ ] 查看从西雅图到日本的航班选择
## 研究城市和景点
- [ ] 研究东京的景点和活动
- [ ] 研究京都的历史遗迹和文化体验
- [ ] 研究奈良鹿公园及周边景点
- [ ] 研究大阪的美食和文化体验
- [ ] 寻找隐藏的宝藏和非热门地点
- [ ] 研究文化体验(剑道、茶道、禅修)
## 规划7天行程
- [ ] 创建每日行程并安排时间
- [ ] 规划城市间的交通
- [ ] 平衡城市探索与文化体验
- [ ] 留出放松和自发探索的时间
- [ ] 确保行程符合预算限制(2500-5000美元)
## 研究求婚地点
- [ ] 确定风景优美且浪漫的求婚地点
- [ ] 研究所选地点的最佳求婚时间
- [ ] 规划求婚时刻的细节
## 整理日语短语和旅行建议
- [ ] 创建常用日语短语清单
- [ ] 整理文化礼仪建议
- [ ] 研究餐饮习俗和美食推荐
- [ ] 整理安全和紧急信息
## 创建HTML旅行手册
- [ ] 设计HTML手册结构
- [ ] 创建地图部分,标出关键位置
- [ ] 编写景点描述
- [ ] 加入日语短语部分
- [ ] 添加旅行建议部分
- [ ] 确保设计适配移动设备
## 完成并交付文件
- [ ] 审查并最终确定7天行程
- [ ] 测试HTML手册功能
- [ ] 整理所有文件和资源
- [ ] 向用户交付最终成果
Manus将会根据md文件的to do list去逐一完成每个板块,其中每个板块的具体实现涉及大量的computer use、deep research以及coding agent。
搜索网页(一次检索23个结果)
Browser use
Manus 通过browser use 去实现网页的浏览和操作(如滚动,点击事件),每一步操作都会截图保存。
浏览
向下滚动
点击
虚拟机环境的交互,比如涉及虚拟机终端命令运行,浏览器的交互,文件的管理(增删改)等
终端交互:
浏览器的交互:如2.1 browser use
文件管理
manus将涉及到代码的任务分发给coding agent进行完成,如html,py等文件的编写,coding agent 这块官方的实现效果有点像是用claude的模型实现的。
综合以上,Manus会根据todo.md文件的事项清单通过computer use、deep research以及coding agent的结合逐步去完成任务。随着任务不断进行,每完成一定任务会编辑todo.md文件标识[x]已完成进行更新md文件(agent的上下文记忆)
示例:7-Day Japan Itinerary with Proposal Ideas
# 日本旅行计划清单
## 研究日本旅行基础知识
- [x] 创建项目目录结构
- [x] 研究最佳交通选择(JR Pass、当地交通)
- [x] 研究四月份的天气
- [ ] 检查美国公民的签证要求
- [ ] 研究货币兑换和预算分配
- [ ] 查看从西雅图到日本的航班选择
## 研究城市和景点
- [x] 研究东京的景点和活动
- [x] 研究京都的历史遗迹和文化体验
- [x] 研究奈良鹿公园及周边景点
- [ ] 研究大阪的美食和文化体验
- [x] 寻找隐藏的宝藏和非热门地点
- [x] 研究文化体验(剑道、茶道、禅修)
## 规划7天行程
- [x] 创建每日行程并安排时间
- [x] 规划城市间的交通
- [x] 平衡城市探索与文化体验
- [x] 留出放松和自发探索的时间
- [x] 确保行程符合预算限制(2500-5000美元)
## 研究求婚地点
- [ ] 确定风景优美且浪漫的求婚地点
- [ ] 研究所选地点的最佳求婚时间
- [ ] 规划求婚时刻的细节
## 整理日语短语和旅行建议
- [ ] 创建常用日语短语清单
- [ ] 整理文化礼仪建议
- [ ] 研究餐饮习俗和美食推荐
- [ ] 整理安全和紧急信息
## 创建HTML旅行手册
- [ ] 设计HTML手册结构
- [ ] 创建地图部分,标出关键位置
- [ ] 编写景点描述
- [ ] 加入日语短语部分
- [ ] 添加旅行建议部分
- [ ] 确保设计适配移动设备
## 完成并交付文件
- [ ] 审查并最终确定7天行程
- [ ] 测试HTML手册功能
- [ ] 整理所有文件和资源
- [ ] 向用户交付最终成果
从todo.md可以看到最后一项任务是完成并交付文件
## 完成并交付文件- [ ] 审查并最终确定7天行程- [ ] 测试HTML手册功能- [ ] 整理所有文件和资源- [ ] 向用户交付最终成果示例:Comprehensive Tesla Stock Analysis and Investment Insights## 10. 向用户提交报告- [ ] 完成所有报告组成部分- [ ] 确保所有分析完整且准确- [ ] 将报告与所有支持文件打包- [ ] 向用户提交最终报告
这一套工作下来会产生多个交付文件
为了增强用户体验,官方也设计了一个管理会话文件的地方方便用户管理。
Manus有自己的知识和记忆,知识让 Manus 能够学习您的偏好和任务特定的最佳实践。Manus 会在需要时自动回忆相关知识。这样就可以教Manus在下一次处理类似的任务会怎么做?
这个知识关键是描述清楚让Manus知道在什么情况下需要用到这个知识。
以下是官方视频demo中提到的示例,“在为招聘目的筛选简历时,直接将结果汇总到电子表格中”,这样下次Manus处理类似任务就会继续通过表格汇总实现
Manus的交互效果做的非常惊艳,特别是会话回放的流失输出效果以及右侧的实时进度跟踪。那这样就可以实时知道Manus完成任务的进展到哪了。
总的来说,Manus就是一个整合了 computer use、deep research、coding agent等概念的会规划并执行的Multiagent system ,并在前端交互用户体验上做到了极致。正如官方说那样:
“我们坚信并践行 less structure more intelligence 的哲学:当你的数据足够优质、模型足够强大、架构足够灵活、工程足够扎实,那么 computer use、deep research、coding agent 等概念就从产品特性变为了自然涌现的能力。”
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-11
大模型无缝切换,QwQ-32B和DeepSeek-R1 全都要
2025-03-11
Manus AI:一夜爆红的AI新星——谈谈我的感受
2025-03-11
Manus 的胜利是产品的胜利
2025-03-11
尽可能简单地解释模型上下文协议MCP
2025-03-11
AI Agent的瓶颈与AI WorkFlow的流行
2025-03-11
当天复刻Manus,CAMEL-AI 聊Agent及Agent协作的发展趋势
2025-03-11
喝点VC|红杉对话OpenAI Deep Research团队:AI Agent将成为今年最具突破性技术,强化学习重新回归主流
2025-03-11
活久见!靠这篇搞懂AI Agent原理
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-05-28
2024-07-31
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-10
2025-03-10
2025-03-10
2025-03-10
2025-03-08
2025-03-08
2025-03-07
2025-03-07