我要投稿

Manus，为何是他们做出来了？

发布日期：2025-03-07 07:36:00 浏览次数： 1851 作者：AI产品黄叔

故事从去年10月26日说起，在那天，黄叔非常喜欢的Arc浏览器被创始人Josh Miller决定战略性放弃，开始开发新的AI Agent浏览器Dia：　

同一天，HideCloud和Peak刚从武汉飞回北京，落地后，HideCloud震惊的发现，打开手机刷的第一条推特就是上面这条，因为，此前的两天，他们在武汉决定了终止AI浏览器的研发工作，莫名其妙的中美两只团队在同一刻达成了共识。　

为何放弃AI浏览器？　

其实去年做AI浏览器还是挺容易理解的决定，Arc也是2023年Product Hunt年度产品的第二名（第一是GPT4）：　

但是在实践中，团队发现个AI浏览器有一些问题，首先是浏览器是给单用户用的，那一旦AI要开始干活，咱们就只能眼睁睁的看着它，变成AI要和我们抢浏览器用了，这肯定不对。　

对的应该是：AI需要用浏览器，但不是在浏览器里面用，AI Should use browser，not in browser，那在哪用呢？在云端用！The browser should be in cloud。　

所以我们现在看Manus，会发现右侧AI在自己操控浏览器：　

在做AI浏览器的过程中，团队主营业务自己也基于很多场景做Post-training，在这个过程中发现基座模型越来越强大，其中有一个非常重要的信号：　

“Less structure，more intelligence”　

这句话很重要，对内构成了整个团队的凝聚力，让Manus团队顶过了过去的三个月，最终把它做了出来，也是Manus和其他产品不一样的关键：　

Manus尽量减少人工对模型的控制，只需要做好铺垫，让AI自己发挥，反过来让AI教我们做人。　

（这句话在Manus官网的底部）　

这样，只需要基础模型能力提升，数据增加，很多能力会自然演化出来，不需要通过workflow的方式强行教会AI。　

这个非常反常识，也确实因为这样，初期很多投资人看完演示后会问：你们团队有多少人做workflow？　

Manus的团队会说：没人，是模型自己做的！结果投资人都不相信。　

但这是Manus的底层信仰！也是AI Agent Manus诞生的契机！　

在这个信仰之上，做好Manus，需要给它三个东西：　

第一：Give it a computer　

就像招一个员工，入职就得给他配电脑，不然他没法办公呀！电脑有了，权限也给配上！　

第二：Give it data access　

有了电脑，还要让他能上网，能看公司的知识库，于是给接入了大量的私有API，这样才能获得权威的结构化的数据，后面才能处理。　

第三：Give it some training　

再做一个入职培训，包括有个mentor带着（对Manus来说就是我们用户啦），时不时给它反馈！　

这样，Manus就可以开始干活了，随着在我们手下打工，还能持续进化！　

简单说完上面的故事后，为何Manus是这个团队率先做出来了？这就是天时地利人和了。　

天时：前面说了，整个公司在做产品过程中，发现了一个很关键的非共识：“Less structure，more intelligence”，这里很重要的是：模型的intelligence开始进化到了可以做Agent的阶段！　

这是技术成熟度，开始和市场需求可以进行契合的时间点！　

地利：此前正好做AI浏览器，很多前置探索都已经积累下来了，包括整个初创公司很扁平，决策可以很快贯彻下来，资源协调非常快！　

人和：这个我感受最深刻，HideCloud和Peak两人在分享时配合非常默契，经常有无声的配合，这种有共同目标，一起冲刺的团队真的令人羡慕！　

不光配合默契，两人的能力也到了能驾驭这款产品的水准，1+1>2。　

诚然，现在的Manus还是个preview的版本，确实不建议对它抱有过于乐观的预期，Manus团队也坦言有很多工作可以优化，但每一次Manus还是会惊艳到大家。　

黄叔的测试里，看到它确实会用多模态看完视频，基于画面分析后给出正确答案，海辛分享的一个案例，在找一个转绘的教程的时候，Manus看着看着网页就点了举报。　

对于深度搜索，可以直接生成带交互的网页，让人印象深刻：　

也会发现不少失败的案例，比如下面这个Manus提示需要登录Youtube，但我接管后操作被Youtube提示需要换浏览器，我和Manus说过后，它无法实现这个操作，最后用观看视频的描述文字做总结，变通的完成了任务。　

也有让生成文字游戏无法实现预期目标，多次修复陷入死循环的case：　

回到Manus发布的当晚，黄叔陷入了一种虚无的情绪：如果Manus真的这么牛，那AI编程还有价值么？现场我问了Peak，他很肯定的告诉我，价值很大！　

再到今天，这件事情也很清晰了，在底模能力没有显著突破的前提下，Agent类产品可以达到的边界，还是可以预期的，Manus离真正的通用Agent还有距离，但依然很惊艳！　

2025年，很值得期待。　

说几个花絮，今天黄叔受邀到北京线下参加了人数极少的交流会，原定10点半开始的活动，我9点半就到了，于是我提前见了两位核心成员：HideCloud和Peak　

HideCloud说，昨晚3点半才回酒店，回去的时候手机电量说80%，早上起来手机被震动到没电。。。　

我问Peak产品发布后兴奋不？他说比起兴奋，现在更多是疲惫。确实最近太辛苦了！　

现场是在一个类似于K歌房的多功能会议室里进行的，确实非常的小，最后总共到场的就几个人，都是Manus团队的朋友，黄叔在受邀之列也是与有荣焉：　

开场时，两位引领了25年Agent创新的精神小伙，摆出了姿态：和老朋友们聊聊。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-21

“算法备案与大模型备案：你们是否已完成双备案？”

2025-04-21

vLLM部署Deepseek（CPU版）踩坑记录（失败经验贴）

2025-04-21

一台3090就能跑Gemma 3 27B！谷歌发布Gemma 3全系QAT版模型

2025-04-20

MCP vs Function Calling，该如何选？

2025-04-20

国内企业应用AI大模型赋能软件测试的落地实践案例

2025-04-20

8卡H20运行DeepSeek-V3-0324性能和推理实测

2025-04-19

低延迟小智AI服务端搭建-ASR篇（续）：CPU可跑

2025-04-19

LoRA 与QLoRA区别

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

FP8 低精度训练：Transformer Engine 简析

2024-07-11

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

大家都在问

MCP vs Function Calling，该如何选？

2025-04-20

RAGFlow vs Dify, 商业化落地场景选哪个？

2025-04-01

如何利用Dify轻松构建你的专属语料库？

2025-03-31

从 0 到 1，Agentic Ops 如何打造企业级 AI 生产力？

2025-03-20

DeepSeek-R1的Qwen-32B蒸馏模型与QwQ-32B模型，谁更强？

2025-03-16

部署DeepSeek的4条路，企业级客户到底该咋走？

2025-03-16

谷歌Gemma 3 27b 到底能不能打，写个游戏测试下？

2025-03-13

强化学习(RL)是什么? 它和微调有什么区别?

2025-03-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB