微信扫码
添加专属顾问
我要投稿
Manus的诞生标志着AI技术的新纪元,它如何成为首个通用AI Agent? 核心内容: 1. Manus的突破性特点与行业反响 2. 技术本质:非同寻常的“套壳”应用 3. Manus超越巨头的秘诀与未来影响
在人工智能的发展长河中,总有那么几个时刻让人恍然大悟:原来,未来已经悄然到来。2025年3月5日夜,Manus的横空出世,正是这样一个时刻。
确实是一个ChatGPT moment,图源:AI产品黄叔
从内部发布会的第一手消息开始,Manus的神奇之处便如病毒般在社交媒体上扩散。一位和我一起参加了闭门户的朋友在朋友圈中写道:"Manus让我看到了AGI的一瞥!"这句话很快成为了无数转发的高频引语。有趣的是,这并非市场营销的精心设计,而是真实用户体验后发自内心的惊叹。
业内专家们纷纷发表评论,认为Manus代表了AI Agent领域质的飞跃。一位资深AI研究员(兼好基友)直言:"Manus不仅超越了OpenAI的同类产品,更是打败了YC W25批次中约四分之三的Agent创业公司,这种领先优势几乎是碾压性的。"
用户们分享的使用体验更是令人咋舌:有人用它完成了原本需要团队合作三天的市场调研,仅用两小时就得到了比人工更全面的分析报告;有人让它设计并实现了一个小型网站,从构思到上线全程无需人工干预;甚至有用户报告说,Manus能够自主学习新工具的使用方法,包括使用YouTube视频快进快捷键来高效获取信息。
上一次这种场景还是Deepseek,图源:互联网
一时间,科技媒体、投资圈、开发者社区都在讨论同一个问题:Manus为何能做到这一切?它是如何在短短几个月内,从无到有,超越了那些有着雄厚资金和技术储备的巨头?
要理解Manus的成功,首先需要直面一个事实:从技术角度看,Manus确实是一种基于大语言模型的"套壳"应用。
是套壳但不是只是套壳,图源:互联网
但这里的"套壳",已远非我们通常理解的那种简单API调用。如果说普通的AI套壳应用像是给跑车换了个外壳,那么Manus则是在跑车的基础上,重新设计了传动系统,优化了动力输出,并加装了全新的导航系统和智能驾驶辅助。
Manus的技术架构由三大核心部分组成:Claude的MCP协议应用、专用RL小模型和自研工具包生态。这三者不是简单的叠加,而是经过精心设计的深度融合,形成了一个超越单纯调用API的复杂生态系统。
正是这种融合式创新,使Manus在保持惊人的成本效益(单任务仅2美元,远低于行业平均水平)的同时,实现了超越OpenAI DeepResearch的技术性能。
一位资深工程师评价道:"Manus的架构设计体现了对AI能力的深刻理解,它没有试图创造新轮子,而是把现有的轮子组装成了一辆前所未有的高性能赛车。"
Manus成功的第一大秘密,在于对Claude的多环境处理(MCP)协议的巧妙应用与创新。
很少有人知道,Claude模型在训练过程中已经掌握了大量常见的DOM(文档对象模型)和CMD(命令行)指令。这些能力就像隐藏在模型中的宝藏,等待有人来挖掘。Manus团队正是抓住了这一点,将Claude原本就具备但未被充分利用的能力发挥到了极致。
MCP真的重要,图源:互联网
在Manus的系统中,AI可以自如地操作网页元素、执行系统命令、处理多模态信息,同时保持上下文的连贯性。这不只是简单的API调用,而是对模型能力的深度激发。就像一位音乐老师能从普通钢琴上弹奏出令人陶醉的乐章,Manus让Claude展现出了远超预期的能力。
这种应用如此成功,以至于有行业内部人士半开玩笑地说:"如果我是Anthropic,看了Manus的演示视频后,下一个版本的Claude我就不会开放了。"这句话虽然有些夸张,但也从侧面反映了Manus对基础模型能力挖掘之深。
事实上,Claude的CPO在最近的一次访谈中提到,他们正在考虑"从模型提供商转变为应用提供商"。这一战略转向,某种程度上也是Manus等创新应用给模型公司带来的压力和启示。
如果说Claude的MCP协议是Manus的"肌肉",那么其自研的强化学习(RL)小模型则是系统的"大脑"。
这个专用小模型负责系统中最关键的决策环节:意图识别、任务规划和工具调用。它就像一个经验丰富的项目经理,能够准确理解客户需求,将大型项目拆分为可执行的小任务,并为每个任务分配最合适的资源。
在任务初始化阶段,RL小模型能精准识别用户意图,并自动创建相应的环境。例如,当用户提出"帮我计划一次日本旅行"的请求时,小模型会立即提取关键词"japan-trip",创建任务文件夹,启动docker容器,为后续执行做好准备。
昨天刚写了RL之父拿了24年的图灵奖,图源:互联网
更关键的是,小模型会生成一个结构化的todo.md文档,详细列出所有需要完成的步骤。这个看似简单的文档,实际上是整个系统的"中央指挥台",所有执行过程都围绕它展开。
引入RL小模型的另一个显著好处是大幅降低了对大模型的调用频率。通常情况下,大模型需要处理大量上下文信息才能做出决策,这不仅耗时还十分昂贵。而小模型专注于特定任务,运行效率更高,成本更低,是Manus能够将单任务成本控制在2美元的关键因素之一。
如果要用一个词来描述Manus的工作流程设计,那就是"优雅"。
在Manus系统中,todo.md文件作为核心上下文管理工具,扮演着至关重要的角色。它不只是一个简单的任务列表,而是整个系统的"记忆中枢"和"指挥中心"。
to do list的含金量到AI这里也是满满的,图源:互联网
每一个待执行的任务都用"[ ]"标记,已完成的任务则更新为"[x]"。主线程不断检查todo.md的状态,将待执行任务交给相应的agent处理,然后更新任务状态。这种设计看似简单,却解决了AI Agent长期面临的上下文管理难题。
一位分析Manus系统的工程师评价道:"todo.md是唯一手段,todo文档本身就是对任务及其状态的最好抽象。模型执行动作的过程信息其实信息密度太低,不需要再塞入上下文中,关键是保持执行反馈与todo.md之间的动态联系。"
与此同时,Manus构建了一套丰富的工具包生态,使AI能够执行连接数据源、执行命令、创建编辑文件、搜索浏览网页等核心动作。这些工具就像AI的"手"和"脚",让它能够与现实世界进行交互。
这个首个通用AI员工会的真多啊,图源:互联网
从回放记录中可以看到,Manus的AI能够熟练地在虚拟机上执行各种操作:从搜索引擎获取信息,浏览网页内容,捕获视觉信息,甚至进行编程和数据分析。这一切都围绕着todo.md进行组织和追踪,形成了一个高效、连贯的工作流程。
"减少人工对AI的限制,让AI模型发挥作用,不要老想着让它做人。让它来教我们做人。"
这句来自Manus团队的原话,简洁而深刻地概括了他们的核心理念:Less Structure, More Intelligence(更少的结构,更多的智能)。
Hidecloud老师灵魂一指,图源:AI产品黄叔
传统的AI Agent开发思路往往是:设计一套严格的流程和规则,让AI按部就班地执行。这种方法就像是在训练一个听话的机器人,虽然可靠,但也极大限制了AI的潜力发挥。
Manus团队走了一条完全不同的路。他们认为,应该赋予AI更多自主权,让模型自己决定如何使用工具和完成任务。就像对待一个聪明的实习生,你不需要告诉他每一步该怎么做,只需要给他明确的目标、必要的资源,然后相信他能找到最佳方案。
这一理念在实践中取得了惊人的效果。用户报告说,Manus不仅能完成预定的任务,还能自主学习新技能,找到更高效的解决方案。例如,在观看YouTube视频时,它学会了使用快捷键来快进视频,大大提高了信息获取效率。
一位用户感叹道:"使用Manus就像雇佣了一个天才实习生,他不仅能完成你交代的任务,还会主动思考如何才能做得更好。"
这种"放手让AI自主发挥"的理念,看似简单,实则颠覆了传统AI应用的设计思路,是Manus成功的关键因素之一。
Manus的成功,离不开其背后团队的卓越执行力和对产品细节的极致追求。
在AI技术日新月异的当下,时间就是一切。Manus团队深谙此道,他们敏锐把握了3个月这个关键的战略窗口期。正如团队内部所说:"大厂决策周期难以跟上AI领域变化,甚至一个OKR都长于技术变化周期。"
这种快速迭代的能力,是创业团队相对于大公司的核心优势。当大公司还在开会讨论要不要做某个功能时,Manus已经完成了三轮迭代,并根据用户反馈进行了多次优化。
这也是为什么是他们做出来Manus,图源:AI产品黄叔
团队的技术积累同样功不可没。Manus的创始团队此前在浏览器产品领域有深厚积累,开发了多项独家创新功能。这些经验为AI Agent与浏览器的深度融合奠定了基础,使"Give it a computer"这一理念得以实现。
有一个感人的小插曲:当Manus在GAIA指标上超越OpenAI DeepResearch的那个晚上,PeakJi和@hidecloud流泪了。
创始团队在为Manus命名时也颇费心思。据内部人士透露,他们曾考虑过"dodo.ai"这个名字,口号是"Just DODO it",但最终选选择了"Manus"——这是拉丁语中"手"的意思,寓意AI成为用户的得力助手。这些细节反映了团队对产品的全方位思考。
Manus不仅在技术上实现了突破,还重新定义了AI产品的价值衡量标准——从传统的日活用户(DAU)转向代理时间每用户(AHPU)。
Manus团队认为,对于AI Agent产品而言,DAU是一个过时的指标。未来衡量AI产品价值的核心不是"有多少人使用了它",而是"它为用户节省了多少时间,完成了多少任务"。
AHPU(Agentic Hours Per User)这一新指标,精确衡量了用户委托AI完成任务的时间效率。如果一个用户通过AI在8小时内完成了相当于24小时的工作量,那么AHPU就是3。这才是AI真正创造价值的体现。
在成本控制方面,Manus同样表现出色。通过一系列技术优化(如KV cache优化、推理时延压缩、执行流程精简等),Manus将单任务成本控制在了惊人的2美元,远低于行业平均水平。
于此同时OpenAI在要涨价到2万美元一个月,图源:互联网
正如一位投资人所说:"Manus重新定义了AI的商业模式。它不是要占用用户的注意力,而是要替用户处理事务,释放注意力。这是一种全新的价值创造模式。"
2025年,被许多人称为AI Agent的元年。Manus的出现,无疑是这一预言的最有力佐证。
从ChatGPT到Claude再到如今的Manus,AI的竞争焦点正在从"思考"能力转向"行动"能力。不再是谁能回答得更好,而是谁能做得更多。
这一转变将带来巨大的产业影响。首先是推理算力需求的爆发性增长。与简单的聊天机器人相比,AI Agent对token的消耗是指数级的。有分析预测,未来一年推理需求将增长100-1000倍,这对NVIDIA和云服务提供商而言无疑是重大利好。
昨天没睡的已经上车了,图源:华尔街见闻
其次是用户与AI交互方式的根本变革。"劳动力扩展"(Labor Scaling)将成为新范式,用户不再是AI的操作者,而是多个AI代理的"老板"或"指挥官"。正如Manus团队所说:"AI这个时代最挑战的是当老板的能力。我们只会当牛马。其实最考验的是怎么当老板。"
对模型公司而言,Manus的成功也将带来深刻思考。未来模型公司与应用公司的边界可能日益模糊,就像Claude CPO在访谈中提到的转型意向。模型公司可能会更多地参与到应用层面,而应用公司则会更多地影响模型的演进方向。
从技术角度看,代码优先策略(利用LLM原生编程能力)、多模态网页交互和动态学习机制将成为AI Agent的核心竞争点。Manus在这些方面已经先行一步,未来会有更多创新者加入这一赛道。
正如一位行业观察者所言:"等到2035年,回看这十年发生什么,我赌AI跟机器人会到处都是,新一代的创业者还会打造更多大疆和DeepSeek。那时候,我们一定会清醒自己经历了以最好的vintage。"
而Manus,毫无疑问将被铭记为这个时代的开创者。
Manus的横空出世,不仅仅是一个产品的成功,更是一个时代的开端。
它告诉我们,AI的未来不在于模型有多大、参数有多少,而在于如何巧妙地组合现有技术,赋予AI真正的行动力。它不是要替代人类,而是要成为人类的得力助手,释放我们的创造力。
正如Manus团队所相信的:"Less Structure, More Intelligence"。有时候,放手让AI自由发挥,它会给我们带来惊喜。
这或许就是Manus能够成为第一个通用AI Agent的终极秘密:不是控制,而是赋能;不是限制,而是释放。
在这个AI Agent的元年,Manus为我们展示了一种可能性:未来的AI,将不再是被动的工具,而是主动的助手;不再只是回答问题,而是解决问题。
而这,才刚刚开始。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-05-28
2024-07-31
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-08
2025-03-08
2025-03-07
2025-03-07
2025-03-05
2025-03-05
2025-03-05
2025-03-04