微信扫码
添加专属顾问
我要投稿
Manus是否真正代表了AI Agent的突破性进展? 核心内容: 1. Manus作为通用Agent模型的介绍和功能展示 2. 探讨Manus是否真正实现了通用Agent的目标 3. Manus与AutoGPT和AgentGPT的对比分析
AI Agent可能会是大公司开放能力,专门的公司来制作Agent服务,或者提供服务的公司自己结合AI能力制作Agent
本周四(3.6),号称通用Agent的Manus突然火了起来,难道这么快Agent的ChatGpt时刻就到了吗?
很多人可能还不清楚Manus是什么,这里先简单用几句话介绍一下:
Manus是一个国产Agent模型,不同于聊天模型,用户问一个问题他不仅只是回答一下答案,而是会自主分解任务,逐步完成各个分解任务,用户只需要等着获取最终结果即可。
这个过程可能会花费较长的时间,它背后运行在多个虚拟机上,负责完成各个分解的任务和执行,任务的执行可能会用到浏览器、编程IDE等。
比如用户跟它说“需要四月份去日本旅游7天”,它接到任务后就会去查询各个信息,景点、酒店、机票、天气情况、旅游攻略等,然后生成一个旅行手册,安排好每一天的计划,方便用户安排游玩计划。
贴一个它的官网宣传视频:
但是,持续关注过AI的人可能会有似曾相识的感觉:这不是AgentGPT吗?
再贴一个AgentGPT的视频:
除此之外,还有个更底层的框架叫做:AutoGPT。
所以问题来了,它是真的有什么新的创新吗?它真的是像它号称的那样是通用Agent吗?
我在前面一些文章里讲过Agent的原理,它并不是模型拥有了什么新的特殊的能力,而是模型借助Function Calling获得了与外界工具交互的能力,本质上还是从各处取了一点数据,它来聚合生成。
理论上,通用Agent的目标是解决不限场景的任务。这意味着它需要具备调用各种工具的能力。
那么它会使用所有的工具吗?人不能但它是AI,完全有可能。
那它可以访问所有的工具吗?如果所有工具都能以HTTP的形式开放,Agent在技术上确实有可能访问它们。
从这个角度来说,Manus可以被认为是一个通用Agent。
它本质上就是给AutoGPT套了一个好用的界面,比AgentGPT的使用体验更好。AutoGPT是一个技术框架,而AgentGPT的产品设计更像是一个程序员产品。
这里先对比一下二者,Manus和AutoGPT。
对比维度 | AutoGPT | Manus |
相同点 | ||
不同点 | ||
用户定位 | ||
任务流程控制 | ||
灵活性 | ||
集成能力 |
Manus和AutoGPT、AgentGPT等相比,本质上没有区别。UI、交互设计是竞争力,但可能不是第一竞争力。而当下AutoGPT、AgentGPT已几无声量,沉寂良久,作为国产厂商,我倒是希望Manus能杀出一条血路。
不是所有的能力都是基于HTTP,也不是所有的能力都可以被公开访问。
拿上面的官方日本七日游的例子来举例,他肯定没办法帮我订机票订酒店。机票预定、酒店预定这些不是单纯的信息查询,涉及复杂的鉴权认证、交易、支付等复杂流程能力。这也是我认为Agent应用落地可能最先会由服务提供厂商实现的理由之一。
AI能力像是传统互联网时代的信道,有应用掌控权的还是数据拥有者。Agent也一样,重要的不是AI能力,而是拥有解决具体问题能力的服务提供方。
你可以通过携程让它的AI功能自动帮你预定日本七日游的酒店,而不能让AI能力自动帮你预定酒店。所以要么是一个个垂类的Agent应用先落地,要么是一个中心化的Agent公司,从各个服务能力所有者获得了授权,而后集中了一批的实用Agent,再统一提供通用的Agent服务。
刚好刷推看到个帖子:
这大概就是实际终端用户在使用AI产品时的真实体感了,看似思考了很久,忙了一堆事情,结果你以为它“干了票大的”,但实际它“拉了坨大的”。。
很多时候,你从马蜂窝这样的旅游攻略网站上找了一份攻略,你都不一定愿意直接照做。而AI Agent也仅是帮你自动化地完成了信息检索、自行筛选生成了一份攻略,你不相信人做的适合你,同样地,你为何会认为AI做的会合适?
Manus很有价值,它将AI自主决策实现任务拆解,提供端到端的处理结果产品化了,在信息处理、数据分析场景自动化了,避免了需要用户多次查询、整理。
但是它的创新有限,实用性还欠缺,还远算不上Agent的ChatGpt时刻。它现在还开启了邀请机制,网上甚至出现了高达8.8万元的邀请码交易,普通用户完全没有必要盲目追捧。。。
期待它能尽快研发,带来更多惹人瞩目的新功能新特性。让我们持续观望,让子弹再飞一会儿~
毕竟,
模型迭代浪潮涌,
各领风骚各不同。
你方唱罢我登场,
静待后浪逐前踪。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-02
2025-04-02
2025-04-01
2025-04-01
2025-04-01
2025-03-30
2025-03-30
2025-03-28