我要投稿

深度拆解：为什么Manus能成为第一个通用AI Agent

发布日期：2025-03-07 07:40:14 浏览次数： 3672 作者：01Founder

在人工智能的发展长河中，总有那么几个时刻让人恍然大悟：原来，未来已经悄然到来。2025年3月5日夜，Manus的横空出世，正是这样一个时刻。

1. Manus的横空出世

今天，科技圈因Manus而沸腾。这款被誉为"第一个真正通用AI Agent"的产品，以摧枯拉朽之势席卷了整个行业的注意力。

确实是一个ChatGPT moment，图源：AI产品黄叔

从内部发布会的第一手消息开始，Manus的神奇之处便如病毒般在社交媒体上扩散。一位和我一起参加了闭门户的朋友在朋友圈中写道："Manus让我看到了AGI的一瞥！"这句话很快成为了无数转发的高频引语。有趣的是，这并非市场营销的精心设计，而是真实用户体验后发自内心的惊叹。

业内专家们纷纷发表评论，认为Manus代表了AI Agent领域质的飞跃。一位资深AI研究员（兼好基友）直言："Manus不仅超越了OpenAI的同类产品，更是打败了YC W25批次中约四分之三的Agent创业公司，这种领先优势几乎是碾压性的。"

用户们分享的使用体验更是令人咋舌：有人用它完成了原本需要团队合作三天的市场调研，仅用两小时就得到了比人工更全面的分析报告；有人让它设计并实现了一个小型网站，从构思到上线全程无需人工干预；甚至有用户报告说，Manus能够自主学习新工具的使用方法，包括使用YouTube视频快进快捷键来高效获取信息。

上一次这种场景还是Deepseek，图源：互联网

一时间，科技媒体、投资圈、开发者社区都在讨论同一个问题：Manus为何能做到这一切？它是如何在短短几个月内，从无到有，超越了那些有着雄厚资金和技术储备的巨头？

2. 技术本质：套壳但非简单套壳

要理解Manus的成功，首先需要直面一个事实：从技术角度看，Manus确实是一种基于大语言模型的"套壳"应用。

h5 套壳app常用工具推荐-互联网-一门科技

是套壳但不是只是套壳，图源：互联网

但这里的"套壳"，已远非我们通常理解的那种简单API调用。如果说普通的AI套壳应用像是给跑车换了个外壳，那么Manus则是在跑车的基础上，重新设计了传动系统，优化了动力输出，并加装了全新的导航系统和智能驾驶辅助。

Manus的技术架构由三大核心部分组成：Claude的MCP协议应用、专用RL小模型和自研工具包生态。这三者不是简单的叠加，而是经过精心设计的深度融合，形成了一个超越单纯调用API的复杂生态系统。

正是这种融合式创新，使Manus在保持惊人的成本效益（单任务仅2美元，远低于行业平均水平）的同时，实现了超越OpenAI DeepResearch的技术性能。

一位资深工程师评价道："Manus的架构设计体现了对AI能力的深刻理解，它没有试图创造新轮子，而是把现有的轮子组装成了一辆前所未有的高性能赛车。"

3. Claude的MCP协议应用与创新

Manus成功的第一大秘密，在于对Claude的多环境处理(MCP)协议的巧妙应用与创新。

很少有人知道，Claude模型在训练过程中已经掌握了大量常见的DOM（文档对象模型）和CMD（命令行）指令。这些能力就像隐藏在模型中的宝藏，等待有人来挖掘。Manus团队正是抓住了这一点，将Claude原本就具备但未被充分利用的能力发挥到了极致。

模型上下文协议（MCP）快速入门- 知乎

MCP真的重要，图源：互联网

在Manus的系统中，AI可以自如地操作网页元素、执行系统命令、处理多模态信息，同时保持上下文的连贯性。这不只是简单的API调用，而是对模型能力的深度激发。就像一位音乐老师能从普通钢琴上弹奏出令人陶醉的乐章，Manus让Claude展现出了远超预期的能力。

这种应用如此成功，以至于有行业内部人士半开玩笑地说："如果我是Anthropic，看了Manus的演示视频后，下一个版本的Claude我就不会开放了。"这句话虽然有些夸张，但也从侧面反映了Manus对基础模型能力挖掘之深。

事实上，Claude的CPO在最近的一次访谈中提到，他们正在考虑"从模型提供商转变为应用提供商"。这一战略转向，某种程度上也是Manus等创新应用给模型公司带来的压力和启示。

4. RL小模型的关键作用

如果说Claude的MCP协议是Manus的"肌肉"，那么其自研的强化学习(RL)小模型则是系统的"大脑"。

这个专用小模型负责系统中最关键的决策环节：意图识别、任务规划和工具调用。它就像一个经验丰富的项目经理，能够准确理解客户需求，将大型项目拆分为可执行的小任务，并为每个任务分配最合适的资源。

在任务初始化阶段，RL小模型能精准识别用户意图，并自动创建相应的环境。例如，当用户提出"帮我计划一次日本旅行"的请求时，小模型会立即提取关键词"japan-trip"，创建任务文件夹，启动docker容器，为后续执行做好准备。

强化学习基本概念| My Secret Rainbow

昨天刚写了RL之父拿了24年的图灵奖，图源：互联网

更关键的是，小模型会生成一个结构化的todo.md文档，详细列出所有需要完成的步骤。这个看似简单的文档，实际上是整个系统的"中央指挥台"，所有执行过程都围绕它展开。

引入RL小模型的另一个显著好处是大幅降低了对大模型的调用频率。通常情况下，大模型需要处理大量上下文信息才能做出决策，这不仅耗时还十分昂贵。而小模型专注于特定任务，运行效率更高，成本更低，是Manus能够将单任务成本控制在2美元的关键因素之一。

5. todo.md驱动的工作流程与工具包生态

如果要用一个词来描述Manus的工作流程设计，那就是"优雅"。

在Manus系统中，todo.md文件作为核心上下文管理工具，扮演着至关重要的角色。它不只是一个简单的任务列表，而是整个系统的"记忆中枢"和"指挥中心"。

to do list的含金量到AI这里也是满满的，图源：互联网

每一个待执行的任务都用"[ ]"标记，已完成的任务则更新为"[x]"。主线程不断检查todo.md的状态，将待执行任务交给相应的agent处理，然后更新任务状态。这种设计看似简单，却解决了AI Agent长期面临的上下文管理难题。

一位分析Manus系统的工程师评价道："todo.md是唯一手段，todo文档本身就是对任务及其状态的最好抽象。模型执行动作的过程信息其实信息密度太低，不需要再塞入上下文中，关键是保持执行反馈与todo.md之间的动态联系。"

与此同时，Manus构建了一套丰富的工具包生态，使AI能够执行连接数据源、执行命令、创建编辑文件、搜索浏览网页等核心动作。这些工具就像AI的"手"和"脚"，让它能够与现实世界进行交互。

这个首个通用AI员工会的真多啊，图源：互联网

从回放记录中可以看到，Manus的AI能够熟练地在虚拟机上执行各种操作：从搜索引擎获取信息，浏览网页内容，捕获视觉信息，甚至进行编程和数据分析。这一切都围绕着todo.md进行组织和追踪，形成了一个高效、连贯的工作流程。

6. "Less Structure, More Intelligence"

"减少人工对AI的限制，让AI模型发挥作用，不要老想着让它做人。让它来教我们做人。"

这句来自Manus团队的原话，简洁而深刻地概括了他们的核心理念：Less Structure, More Intelligence（更少的结构，更多的智能）。

Hidecloud老师灵魂一指，图源：AI产品黄叔

传统的AI Agent开发思路往往是：设计一套严格的流程和规则，让AI按部就班地执行。这种方法就像是在训练一个听话的机器人，虽然可靠，但也极大限制了AI的潜力发挥。

Manus团队走了一条完全不同的路。他们认为，应该赋予AI更多自主权，让模型自己决定如何使用工具和完成任务。就像对待一个聪明的实习生，你不需要告诉他每一步该怎么做，只需要给他明确的目标、必要的资源，然后相信他能找到最佳方案。

这一理念在实践中取得了惊人的效果。用户报告说，Manus不仅能完成预定的任务，还能自主学习新技能，找到更高效的解决方案。例如，在观看YouTube视频时，它学会了使用快捷键来快进视频，大大提高了信息获取效率。

一位用户感叹道："使用Manus就像雇佣了一个天才实习生，他不仅能完成你交代的任务，还会主动思考如何才能做得更好。"

这种"放手让AI自主发挥"的理念，看似简单，实则颠覆了传统AI应用的设计思路，是Manus成功的关键因素之一。

7. Manus团队与产品研发细节

Manus的成功，离不开其背后团队的卓越执行力和对产品细节的极致追求。

在AI技术日新月异的当下，时间就是一切。Manus团队深谙此道，他们敏锐把握了3个月这个关键的战略窗口期。正如团队内部所说："大厂决策周期难以跟上AI领域变化，甚至一个OKR都长于技术变化周期。"

这种快速迭代的能力，是创业团队相对于大公司的核心优势。当大公司还在开会讨论要不要做某个功能时，Manus已经完成了三轮迭代，并根据用户反馈进行了多次优化。

这也是为什么是他们做出来Manus，图源：AI产品黄叔

团队的技术积累同样功不可没。Manus的创始团队此前在浏览器产品领域有深厚积累，开发了多项独家创新功能。这些经验为AI Agent与浏览器的深度融合奠定了基础，使"Give it a computer"这一理念得以实现。

有一个感人的小插曲：当Manus在GAIA指标上超越OpenAI DeepResearch的那个晚上，PeakJi和@hidecloud流泪了。

创始团队在为Manus命名时也颇费心思。据内部人士透露，他们曾考虑过"dodo.ai"这个名字，口号是"Just DODO it"，但最终选选择了"Manus"——这是拉丁语中"手"的意思，寓意AI成为用户的得力助手。这些细节反映了团队对产品的全方位思考。

8. Manus的商业价值重构：从DAU到AHPU

Manus不仅在技术上实现了突破，还重新定义了AI产品的价值衡量标准——从传统的日活用户(DAU)转向代理时间每用户(AHPU)。

Manus团队认为，对于AI Agent产品而言，DAU是一个过时的指标。未来衡量AI产品价值的核心不是"有多少人使用了它"，而是"它为用户节省了多少时间，完成了多少任务"。

AHPU（Agentic Hours Per User）这一新指标，精确衡量了用户委托AI完成任务的时间效率。如果一个用户通过AI在8小时内完成了相当于24小时的工作量，那么AHPU就是3。这才是AI真正创造价值的体现。

在成本控制方面，Manus同样表现出色。通过一系列技术优化（如KV cache优化、推理时延压缩、执行流程精简等），Manus将单任务成本控制在了惊人的2美元，远低于行业平均水平。

于此同时OpenAI在要涨价到2万美元一个月，图源：互联网

正如一位投资人所说："Manus重新定义了AI的商业模式。它不是要占用用户的注意力，而是要替用户处理事务，释放注意力。这是一种全新的价值创造模式。"

9. 展望：Manus开启的AI Agent元年

2025年，被许多人称为AI Agent的元年。Manus的出现，无疑是这一预言的最有力佐证。

从ChatGPT到Claude再到如今的Manus，AI的竞争焦点正在从"思考"能力转向"行动"能力。不再是谁能回答得更好，而是谁能做得更多。

这一转变将带来巨大的产业影响。首先是推理算力需求的爆发性增长。与简单的聊天机器人相比，AI Agent对token的消耗是指数级的。有分析预测，未来一年推理需求将增长100-1000倍，这对NVIDIA和云服务提供商而言无疑是重大利好。

昨天没睡的已经上车了，图源：华尔街见闻

其次是用户与AI交互方式的根本变革。"劳动力扩展"（Labor Scaling）将成为新范式，用户不再是AI的操作者，而是多个AI代理的"老板"或"指挥官"。正如Manus团队所说："AI这个时代最挑战的是当老板的能力。我们只会当牛马。其实最考验的是怎么当老板。"

对模型公司而言，Manus的成功也将带来深刻思考。未来模型公司与应用公司的边界可能日益模糊，就像Claude CPO在访谈中提到的转型意向。模型公司可能会更多地参与到应用层面，而应用公司则会更多地影响模型的演进方向。

从技术角度看，代码优先策略（利用LLM原生编程能力）、多模态网页交互和动态学习机制将成为AI Agent的核心竞争点。Manus在这些方面已经先行一步，未来会有更多创新者加入这一赛道。

正如一位行业观察者所言："等到2035年，回看这十年发生什么，我赌AI跟机器人会到处都是，新一代的创业者还会打造更多大疆和DeepSeek。那时候，我们一定会清醒自己经历了以最好的vintage。"

而Manus，毫无疑问将被铭记为这个时代的开创者。

结语

Manus的横空出世，不仅仅是一个产品的成功，更是一个时代的开端。

它告诉我们，AI的未来不在于模型有多大、参数有多少，而在于如何巧妙地组合现有技术，赋予AI真正的行动力。它不是要替代人类，而是要成为人类的得力助手，释放我们的创造力。

正如Manus团队所相信的："Less Structure, More Intelligence"。有时候，放手让AI自由发挥，它会给我们带来惊喜。

这或许就是Manus能够成为第一个通用AI Agent的终极秘密：不是控制，而是赋能；不是限制，而是释放。

在这个AI Agent的元年，Manus为我们展示了一种可能性：未来的AI，将不再是被动的工具，而是主动的助手；不再只是回答问题，而是解决问题。

而这，才刚刚开始。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业