微信扫码
添加专属顾问
我要投稿
Manus AI agent的革命性产品设计,为Agent产品的未来指明了方向。核心内容:1. Manus的核心功能:虚拟机、自主任务规划及全流程无人值守2. 如何颠覆传统“套壳”认知,实现更广更深的搜索能力3. Manus设计理念“Less structure More intelligence”的深远影响
前晚,一个名为 Manus 的 AI agent 产品 Demo 视频悄然刷屏 AI 媒体圈。
在看完视频后,不得不深夜发博批判自己"过度依赖人工设计",工程思维的固化 & 对模型能力边界的反应迟钝是罪过。这段时间项目上有个困扰我蛮久的问题,Manus 简单的一个 demo 视频就让我茅塞顿开,找到了解法。
次日醒来发现 Manus 已然点爆了国内圈子,一码难求到某鱼上甚至有人花 5 万求一个邀请码——这个让大模型拥有"整台电脑"的通用 Agent,颠覆了人们对'套壳'的认知。
当然一个爆火的产品少不了媒体的吹嘘也少不了没拿到邀请码者的'吃不到葡萄说葡萄酸'。
其实从我的角度来说,Manus 是不是第一个通用 Agent 及其能力如何不是很重要,Manus 团队的 Agent 设计理念 ‘Less structure More intelligence’ 反而对我很有启发。
01 • Manus 做了什么
Manus 名字取自于拉丁语 'Mens et Manus'(即'知行合一',麻省理工的校训)
与市面上需要人工编排 Workflow 的 Coze、dify 等产品不同,Manus 的核心在于:
给模型一台'虚拟机':将 Computer Use 与 Tool Use 深度融合,让模型能独立于人类去工作,不跟人抢电脑;
自主任务规划:模型根据目标自动拆解、规划 Todo 并执行, 而非靠人为搭建 Workflow;
全流程无人值守:从'生成 PPT 大纲'到'输出完整 .pptx 文件',无需人类中途干预;(实测下来某些 case 其实还是需要的,比如碰到验证码的时候)
相当于给 AI 配置了完整的工作台,让它像真人一样操作电脑完成任务,不仅有普通大学生的水平还能任劳任怨地干脏活。
02 • 为什么说改变了人们对'套壳'的认知
除开 Computer Use、MCP、自主规划...这些早已有的概念,有个问题在看到 Demo 视频的当晚我思考了一晚上:
为什么要给模型一台 PC?这跟我直接通过 Function Call 在输出结果上会有什么区别吗?
直到 Manus 放出邀请码,实测了几个 Case 后才有了答案:
首先最大的区别在于,Manus 通过操作浏览器+视觉获取到了更多 API 未能提供的信息,搜索的广度、深度都要多出了不少,在 Deep Research 的工作上不输于普通校招生、实习生。
这点目前能看到最具代表性的 Case 就是海辛老师让 Manus 教她拍恐怖片,Manus 打开了 B 站现学了 20 多分钟,甚至在看了搜狐上相关的文章后还点了举报...(Manus:顺手的事儿~)
众所周知,小红书中拥有着大量优质笔记内容,日均搜索量哒约 6 亿次,近三分之一用户打开小红书的第一件事就是搜索。可惜并没有一个开放的搜索接口让模型能直接获取其中的优质内容。
而模型有了 PC 后,社区便真正没有了围墙。
其次,可以看见的是模型对工具的使用产生了质变,完成了从"顾问"到"高级牛马"的角色进化。
想必大多数人都尝试过让 AI 生成 PPT,结果就是 AI 只会给你输出一通大纲与些许内容,更好点的能调用 AIPPT 套个固定的模版或者直接用 HTML 画一个给你,还得找到‘导出’才能拿到 .pptx 文件。
确实这样能解决一些简单的 PPT 需求,但我真的觉得太反 AI 了。
Manus 把 PC 交给模型,经过其自主地搜集信息、学习,能设计出更符合目标场景的 PPT,并把 .pptx 文件直接交到你手上。
当模型真正开始‘使用’而不仅是‘调用’工具时,人们确实瞥见了一丝通用 Agent 的光。
以下为同样将一份教案交给 AIPPT 以及 Manus 并让他们制作英语教学课件的结果,显而易见的是老师根本不会拿着前者去上课,不然就是教学事故...
无 PC 产出物(Gamma)
带 PC 产出物(Manus)
故 Manus 能爆火、能被媒体吹捧是因为它确实让人们看见了其中一种 Agent 新范式,也改变了人们对产品层‘套壳’所能产生的化学反应的认知。不只是因为邀请码。
诚然,同劝冷静者所说一般,Manus 只是把 Claude、Computer Use、MCP、自主规划等等这些早已在各种 Agent 概念产品实现过的功能进行了一番套壳缝合,没什么技术突破。
但这产品应用上的实现落地,硬要扯到技术上就是对牛弹琴。有的是公司能开发出第二个‘抖音’,但没见有公司能做出第二个‘抖音’。
从结果上来看,Manus 团队能将这些零散的概念深度融合并先行落地,爆火的同时也让更多人了解到 AI Agent,就足够证明优秀。
套壳不捞,捞的是套不好壳、有壳不套。
大家总是会从一个极端走向另一个极端。我们的态度是不要过于捧杀或 diss,甚至还出来了很多阴谋论...过犹不及。能够以足够的包容和理性去看待 Manus,去对待华人创业团队。现在的爆火也是出乎 Manus 团队意料之外的,之所以设置邀请码也是因为 Multi-Agent 很消耗算力资源,很难让这样一个创业团队完全把产品开放给所有用户。
《一些关于 Manus 的独家信息和慢思考》特工宇宙
回归开头主题,个人真真实实地从 Manus 的理念上得到了启发:Less structure,more intelligence ——尽可能地去屏蔽人类的认知框架对模型的限制,多探索模型的能力边界,智能涌现。
受限于对模型能力边界的认知局限,以往在项目中为了满足复杂的 Case,我设计了不计其数的 Prompt、Workflow,最终过多地依赖设计框架来约束模型产出的结果就是‘人工智能、人工智能,人工多于智能’。
在一些场景下给到足够工具后,放手让模型自由创造或许会得到更好的结果。
03 • 上头后的冷水
实话实说,Manus 虽然给 Agent 设计上带来了新的范式,但离真正的通用还有些距离。看了那么多实测 case 后,卡死率还是蛮高的,有这么几个问题:
效率:简单的 case 也要耗时2-4小时,例如电商商品比价,有杀鸡用牛刀的感觉;
资源:没理解错的话,每个任务需独立 Docker 容器,服务器压力巨大;
视觉:模型对 UI 的理解能力显然还不够,除开上下文限制外,大多数任务卡死都是因为界面理解问题;
细分领域:在强依赖细分领域内数据的场景上,即使通过浏览器也无法搜集到有用信息。
算力消耗的问题就不提了,毕竟算力价格一直在‘骨折’。
04 • 对 Agent 赛道两级分化的思考
我们能看见 Agent 创业的两条路径:
通用派:追求 ‘Less Structure, More Intelligent’ 的通用智能;
垂直派:深耕细分领域,用专业知识与不开源的业内数据来构筑护城河。
在 Manus 的闭门分享会上有一页 PPT 内容是这么写的:
‘Agent Killer’ 大致解读是现阶段以 Manus 为代表的通用派已杀死细分派 Agent。
作为身处教育细分赛道的 Agent 设计者,个人是不认同的。
跪拜 Coding 领域有 GitHub 这么一个强大的开源社区,使得 Devin、MetaGPT 成为最先成熟落地且商业化的 Agent。但在金融、医药等其他领域,多的是藏冰山角下的私有数据,数据是最大的护城河。
当大模型尚未内化行业 Know-how 时,细分领域专家设计的 Structure 仍是刚需,业内私有数据训练的专家模型仍不可或缺——不过这扇窗口期可能比想象中更短。
在硅基与碳基的十字路口,人机协作的范式正在被不断改写。变革中没有永恒的赢家,只有持续进化者。感谢 Manus ‘弱框架,强智能’架构带来的启发,或许就是我当前项目的破局点。
感谢阅读,以上为一个练习时长两年半 AI 爱好者的一些浅层认知,欢迎指正,真诚地。
所以 Manus 代表的通用 Agent 已经杀死细分赛道 Agent 了吗?
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-17
零一万物今天的新品发布会,都讲了些什么?
2025-03-17
AGI|Mem0帮你告别健忘症,让AI记住你的一切
2025-03-17
DeepSeek-R1关键创新技术再总结
2025-03-17
MCP到底是什么?统一Function calling规范,工作量锐减至1/6,人人都能手搓Manus?
2025-03-17
当AI开始“赋能”黑产|甲子光年
2025-03-17
华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!
2025-03-17
通义:你的个人AI助手,千事不决问通义
2025-03-17
Vue 首个 AI 组件库发布!
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-17
2025-03-17
2025-03-17
2025-03-16
2025-03-15
2025-03-15
2025-03-12
2025-03-12