AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Manus,为何是他们做出来了?

发布日期:2025-03-07 07:36:00 浏览次数: 1613 来源:AI产品黄叔
推荐语

当AI浏览器成为过去,Manus团队如何引领AI新纪元?

核心内容:
1. AI浏览器的兴起与没落
2. Manus团队的云端AI革命
3. 从“Less structure,more intelligence”看AI的未来

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

故事从去年10月26日说起,在那天,黄叔非常喜欢的Arc浏览器被创始人Josh Miller决定战略性放弃,开始开发新的AI Agent浏览器Dia: 

 

 

同一天,HideCloud和Peak刚从武汉飞回北京,落地后,HideCloud震惊的发现,打开手机刷的第一条推特就是上面这条,因为,此前的两天,他们在武汉决定了终止AI浏览器的研发工作,莫名其妙的中美两只团队在同一刻达成了共识。 

 

为何放弃AI浏览器? 

 

其实去年做AI浏览器还是挺容易理解的决定,Arc也是2023年Product Hunt年度产品的第二名(第一是GPT4): 

Image

 

但是在实践中,团队发现个AI浏览器有一些问题,首先是浏览器是给单用户用的,那一旦AI要开始干活,咱们就只能眼睁睁的看着它,变成AI要和我们抢浏览器用了,这肯定不对。 

 

对的应该是:AI需要用浏览器,但不是在浏览器里面用,AI Should use browser,not in browser,那在哪用呢?在云端用!The browser should be in cloud。 

 

所以我们现在看Manus,会发现右侧AI在自己操控浏览器: 

Image

 

在做AI浏览器的过程中,团队主营业务自己也基于很多场景做Post-training,在这个过程中发现基座模型越来越强大,其中有一个非常重要的信号: 

Image

Less structure,more intelligence 

 

这句话很重要,对内构成了整个团队的凝聚力,让Manus团队顶过了过去的三个月,最终把它做了出来,也是Manus和其他产品不一样的关键: 

 

Manus尽量减少人工对模型的控制,只需要做好铺垫,让AI自己发挥,反过来让AI教我们做人。 

Image

(这句话在Manus官网的底部) 

 

这样,只需要基础模型能力提升,数据增加,很多能力会自然演化出来,不需要通过workflow的方式强行教会AI。 

 

这个非常反常识,也确实因为这样,初期很多投资人看完演示后会问:你们团队有多少人做workflow? 

 

Manus的团队会说:没人,是模型自己做的!结果投资人都不相信。 

 

但这是Manus的底层信仰!也是AI Agent Manus诞生的契机! 

 

在这个信仰之上,做好Manus,需要给它三个东西: 

 

第一:Give it a computer 

Image

就像招一个员工,入职就得给他配电脑,不然他没法办公呀!电脑有了,权限也给配上! 

 

第二:Give it data access 

Image

有了电脑,还要让他能上网,能看公司的知识库,于是给接入了大量的私有API,这样才能获得权威的结构化的数据,后面才能处理。 

 

第三:Give it some training 

Image

再做一个入职培训,包括有个mentor带着(对Manus来说就是我们用户啦),时不时给它反馈! 

 

这样,Manus就可以开始干活了,随着在我们手下打工,还能持续进化! 

 

简单说完上面的故事后,为何Manus是这个团队率先做出来了?这就是天时地利人和了。 

 

天时:前面说了,整个公司在做产品过程中,发现了一个很关键的非共识:“Less structure,more intelligence”,这里很重要的是:模型的intelligence开始进化到了可以做Agent的阶段! 

 

这是技术成熟度,开始和市场需求可以进行契合的时间点! 

 

地利:此前正好做AI浏览器,很多前置探索都已经积累下来了,包括整个初创公司很扁平,决策可以很快贯彻下来,资源协调非常快! 

 

人和:这个我感受最深刻,HideCloud和Peak两人在分享时配合非常默契,经常有无声的配合,这种有共同目标,一起冲刺的团队真的令人羡慕! 

 

不光配合默契,两人的能力也到了能驾驭这款产品的水准,1+1>2。 

 

 

 

诚然,现在的Manus还是个preview的版本,确实不建议对它抱有过于乐观的预期,Manus团队也坦言有很多工作可以优化,但每一次Manus还是会惊艳到大家。 

 

黄叔的测试里,看到它确实会用多模态看完视频,基于画面分析后给出正确答案,海辛分享的一个案例,在找一个转绘的教程的时候,Manus看着看着网页就点了举报。 

 

对于深度搜索,可以直接生成带交互的网页,让人印象深刻: 

Image

 

也会发现不少失败的案例,比如下面这个Manus提示需要登录Youtube,但我接管后操作被Youtube提示需要换浏览器,我和Manus说过后,它无法实现这个操作,最后用观看视频的描述文字做总结,变通的完成了任务。 

Image

 

也有让生成文字游戏无法实现预期目标,多次修复陷入死循环的case: 

Image

 

 

回到Manus发布的当晚,黄叔陷入了一种虚无的情绪:如果Manus真的这么牛,那AI编程还有价值么?现场我问了Peak,他很肯定的告诉我,价值很大! 

 

再到今天,这件事情也很清晰了,在底模能力没有显著突破的前提下,Agent类产品可以达到的边界,还是可以预期的,Manus离真正的通用Agent还有距离,但依然很惊艳! 

 

2025年,很值得期待。 

 

说几个花絮,今天黄叔受邀到北京线下参加了人数极少的交流会,原定10点半开始的活动,我9点半就到了,于是我提前见了两位核心成员:HideCloud和Peak 

 

HideCloud说,昨晚3点半才回酒店,回去的时候手机电量说80%,早上起来手机被震动到没电。。。 

我问Peak产品发布后兴奋不?他说比起兴奋,现在更多是疲惫。确实最近太辛苦了! 

 

现场是在一个类似于K歌房的多功能会议室里进行的,确实非常的小,最后总共到场的就几个人,都是Manus团队的朋友,黄叔在受邀之列也是与有荣焉: 

 

开场时,两位引领了25年Agent创新的精神小伙,摆出了姿态:和老朋友们聊聊。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询