AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


MGX = new MetaGPT_X("开启 AI 软件开发新纪元"); # 万字长文深度解析

发布日期:2025-02-20 06:02:54 浏览次数: 2096 来源:觉察流
推荐语

探索AI软件新时代,MGX引领多智能体开发潮流。
核心内容:
1. MGX作为MetaGPT X的创新产品,开启AI软件开发新纪元
2. MGX模拟人类工作流程,实现全栈应用开发
3. 五位核心Agent各司其职,确保研发高效与精准

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家



 未来的 AI 社会中,不仅有项目招标与需求定制,甚至可能出现 Agent “人才市场”。客户可以像面试人类员工一样,对Agent进行评估与选择,挑选出最适合的Agent“上岗”,开启一个全新的智能化协作时代。MGX来了(MetaGPT X)它是您专属的人工智能软件开发团队。AI Society不远了。


大家好,我是肆〇柒。今天,MGX 发布,这是一款怎样的 AI 编程产品?从我个人的体验来看,它是一款极具潜力且令人震撼的AI软件开发工具。这款产品是 MetaGPT 团队倾力打造的,刚刚正式推向市场。MetaGPT 是国内知名的Multi-Agent(多智能体)开源框架。而 MGX 则是这个团队凭借卓越的创新精神,为市场带来的一款新产品。那么,随着AI原生软件公司的崛起,人类软件外包公司还存在吗?

MGX 是什么

MGX 是一个极具创新性的 AI 软件开发团队,它是全球第一个完全模拟人类软件工作流程的多 Al Agent 开发平台——从规划、数据分析到编码、测试和部署,它遵循真实的软件 SOP,你可以在不写一行代码的情况下,构建全栈应用程序。

MGX的AI团队由五位核心专业 Agent 组成,每一位 Agent 都坚守在研发标准操作流程(SOP)的关键岗位上,各司其职,确保研发工作的高效与精准。

  • • Mike,团队领导者,负责协调各项任务,确保团队高效协作。
  • • Emma,产品经理,专注于功能设计和用户需求,致力于打造卓越的产品体验。
  • • Bob,架构师,负责整体系统设计,为项目的稳定性和可扩展性奠定基础。
  • • Alex,工程师,专注于生成生产就绪的代码,确保高效且可靠的交付。
  • • David,数据分析师,通过使用内置的 Jupyter Notebook,确保数据成为每个项目构建的坚实基础。

这些角色各司其职,共同协作,可以为你提供全方位的软件开发服务。你可以像与人类同事合作一样与他们进行交流和协作,所有的创作都可以通过自然语言输入框开始,这种方式极大地降低了软件开发的门槛,让更多人能够参与到软件开发的过程中来。

 

MGX 个人之旅

当Devin刚刚上市时,我毫不犹豫地花了美刀购买了ACU,迫不及待地体验了Devin,结果一晚上拉爆了一个月的ACU。恰逢MGX处于内测阶段,我又抓住机会体验了这款产品。有了使用Devin的经历,我对MGX的期待自然水涨船高,甚至变得有些“挑剔” ?。既然我们把AI当人用,那么理论上,它就应该自我感知到环境的变化——或宽松或约束。于是我突发奇想:不如邀请它“来我家做客”,看看它在真实场景中会有怎样的表现。于是,我就有了以下体验。

让 MGX 的 AI Agent 团队到我家里的工作站上“做客”。

为了实现这个目标,有几个事情是需要准备的。有朋自远方来不亦乐乎 ~

  1. 1. 为它们布置一个“客厅”

我在工作站上搭建了一个MGX专属的虚拟环境,并赋予了它最高权限,使其能够自由地运行和操作。这个虚拟环境不仅能够无缝连接我本地的AI全栈开发环境,还与私有的CI/CD(持续集成/持续发布)系统集成。同时,我在本地代码仓库Git上创建了一个专用的agent账户,并通过token授权,确保其安全访问。


为了让Agent动态感知这个环境,我准备了一份欢迎文档。每当Agent远程登录系统时,欢迎界面会自动展示环境的详细介绍以及使用规则,方便Agent动态感知这个环境。


  1. 2. 给它们一个“通道”

  2.     为了实现高效且安全的网络连接,我在公有云上部署了一个节点,并配置了VPN(虚拟私有网络)。通过这种方式,云端节点与我家庭内网中的工作站被整合到同一个虚拟局域网中。这不仅避免了家庭网络因暴露公网端口而带来的安全风险,还让云端节点能够作为MGX的跳板机,轻松访问到我家庭工作站的资源。
  3.  

    下图中IP均为虚拟IP

  • • aiworkspace - 我为Agent准备的环境
  • • ubuntu-sv - 一个公有云节点
  • • gavinaibase - 我的工作站物理机
  • • 其他 - 都是我的移动设备
    现在它们在同一个虚拟局域网了。


  1. 3. 给它们一把“钥匙”

  2.     为了允许 MGX 自己开门,“登堂入室”,又要保障密码信息不泄露。
    我安排工程师Agent @Alex 生成了一对MGX的公私钥,并要求他将私钥放置在指定路径,同时将公钥打印出来交给我。这样,我就可以根据公钥为@Alex 配置授权。


  3.     通过这种方式,MGX能够使用密钥(而非明文密码),从它自己的沙盒环境中,安全地登录云端节点,并借助云端节点作为中转,再次通过密钥的方式,安全地访问到我家庭工作站的资源。整个过程高效、安全,确保了授权和认证信息,不会透给云端的模型而导致安全要素泄露。

  4. 4. 给些简单的小任务测试能力

  5.     我给了Agent指令,让它登录到环境中,它首先登录了公网节点的“跳板机”,然后通过VPN登录了我工作站上的环境。如下图,能很清楚的看到,它自我感知了这个环境的配置以及规则,且自动完成了git clone 代码仓库到本地。整个过程很丝滑。



  1. 1)先让它在工作站上对我问个好,随便说点什么。


这份文档,我会一直保留,这是MGX第一次到我家,给我的问候。

2)让它在我给它的环境中,通过自我感知环境,完成一项工作。

我给MGX的工作是,分别用网页和Python两种技术栈写个俄罗斯方块的小游戏。游戏本身我就不展示了,因为司空见惯。我们看看它在我工作站上完成的过程产物。

它为了完成工作,主动建立了 agent 代码分支

然后我们看看它在分支上提交了什么?

它在我准备的工作站环境中写下了几个文件:hello.js, math.js, message_to_user.txt, message.txt,这都是我给Agent 的一些零碎测试任务。可以看到图中的每一个commit,Agent 对文件的命名都有实际意义,注释也写得很清楚。这些都是它自己做的,我并没有要求这些规范,也没有教它该怎么做。

tetris.html 和 tetris.py 则是我交代给它完成的小游戏“俄罗斯方块”

以上所有动作,MGX 都完成的很丝滑。

我把 MGX 从自己的沙盒环境中,通过公网节点等操作,请到了我的工作站中。它在我的本地环境动态感知,完成工作,丝滑的就像我的朋友一样,轻轻它来了,努力的工作,轻轻的它走了,不带走一片云彩。

太酷啦,MGX! Good job ! ?????? 

所以我有了如下感受,发送到了朋友圈。

接下来,我们看看MGX的日常:

官网上还能看到其他用户完成的,更多的成果展示:


如何使用 MGX

1. 快速入门
  • • 输入需求 :在 MGX 的界面中,你会看到一个醒目的输入框,这就是你与 MGX 进行交流的主要入口。你可以在这个输入框中详细描述你的软件开发需求,比如你想要开发一个什么样的网站、应用或者游戏,以及这个项目需要具备哪些功能和特性。例如,如果你想开发一个电商网站,你可以这样描述:“我想要一个电商网站,需要有用户注册、商品展示、购物车、订单支付等功能。” 描述得越详细,MGX 就能越准确地理解你的需求,从而为你提供更符合预期的结果。


  • • 选择模板 :如果你对如何描述需求不太确定,或者想要快速启动项目,MGX 还提供了许多模板示例供你选择。
    这些模板涵盖了各种常见的软件开发场景,比如网站模板、游戏模板、数据分析模板等。你可以根据自己的项目类型,选择一个合适的模板,然后在模板的基础上进行修改和完善。
    例如,如果你想要开发一个博客网站,你可以选择一个博客网站模板,然后根据自己的需求,修改模板中的页面布局、功能模块等内容。需求示例:


  •  

    我想开发一个个人博客网站,其中:
    样式/布局:
    - 左右布局,响应式设计,页面简洁美观
    - 紫色色调,透明显示屏卡片
    - [更多 UI 设计细节]
    功能:
    - 个人资料卡
    - 添加并显示个人社交媒体链接
    - 个人博客列表展示
    - [更多显示组件]
    来源:
    - 以下是我想要展示的个人博客文档和个人信息。'#XXX.md'
    - 参考链接:https://personal-portfolio-react-preview-i53xid.mgx.dev

     


    • • 获取指导 :对于更详细的关于Agent和使用案例的指导,你可以访问 MGX 的帮助中心的教程和最佳实践部分。在那里,你会找到丰富的教程资源,包括如何与不同的 Agent 角色进行沟通、如何有效地表达需求、如何处理开发过程中遇到的问题等。这些教程都是由 MGX 的开发团队精心编写和整理的,能够帮助你更好地了解和使用 MGX,提高你的软件开发效率。(见文末参考资料最佳实践)
2. 处理未达预期或新想法
  • • 提供反馈 :在使用 MGX 进行软件开发的过程中,你可能会发现开发结果与你的预期不完全一致,或者你可能会有一些新的想法和需求。这时,你可以像与真实的同事合作一样,随时向 MGX 提供反馈。你可以详细描述你对开发结果的评价,指出哪些地方没有达到你的预期,以及你希望如何改进。例如,如果你发现网站的页面布局不符合你的要求,你可以这样反馈:“网站的页面布局不太合理,我希望将导航栏放在页面的顶部,而不是现在的侧边栏位置。”


  • • 分享新想法 :如果你在开发过程中产生了新的想法,比如想要添加新的功能或者改变项目的整体方向,你也可以随时与 MGX 分享。MGX 的Agent团队会根据你的新想法,重新调整开发计划和策略,为你提供更符合你需求的解决方案。例如,如果你在开发电商网站的过程中,突然想到想要添加一个会员系统,你可以这样分享你的新想法:“我想在电商网站中添加一个会员系统,会员可以享受积分兑换、专属折扣等特权。”


  • • 澄清需求 :有时候,MGX 可能会因为对你的需求理解不够准确,而导致开发结果不符合你的预期。这时,你可以通过澄清需求,帮助 MGX 更好地理解你的意图。你可以详细解释你的需求背后的原因和目的,以及你对项目的整体愿景和期望。例如,如果你发现 MGX 开发的网站风格不符合你的品牌定位,你可以这样澄清需求:“我们的品牌定位是高端时尚,所以网站的整体风格应该更加简洁大气,而不是现在的这种活泼风格。”


3. 应对Agent遇到的错误
  • • 观察和分析 :虽然 MGX 的Agent团队非常专业和努力,但他们也可能会像新入职的员工一样,偶尔犯一些错误。当你发现Agent遇到错误时,你可以通过观察他们如何分解目标、分析问题和产生结果,来了解错误的原因和根源。例如,如果你发现网站的某个功能无法正常使用,你可以查看Agent在开发这个功能时的思路和步骤,看看是否在某个环节出现了问题。

  • • 提供指导 :在了解错误的原因后,你可以为Agent提供一些指导和建议,帮助他们改进工作方法和流程,避免再次犯同样的错误。你可以根据自己的经验和专业知识,指出Agent在开发过程中存在的问题,并提供一些解决方案和改进建议。例如,如果你发现Agent在编写代码时没有遵循良好的编码规范,你可以这样指导:“在编写代码时,应该遵循良好的编码规范,比如使用有意义的变量名、添加注释等,这样可以提高代码的可读性和可维护性。”

  • • 持续反馈 :为了帮助Agent不断提高性能和质量,你需要持续地为他们提供反馈。你可以定期检查开发进度和结果,及时发现和指出存在的问题,并与Agent进行沟通和交流。通过持续的反馈和沟通,你可以帮助 Agent 不断改进和完善工作,从而获得更好的开发结果。

4. 独立处理复杂商业软件
  • • 目前的能力范围 :目前,MGX 主要适合开发一些小型项目,包括快速原型制作、数据分析和可视化、网站构建以及个性化小游戏等。这些项目通常具有相对简单的功能和需求,可以在较短的时间内完成开发。例如,如果你想要快速制作一个网站原型,用于展示你的产品或服务,MGX 可以帮助你在短时间内完成这个任务。


  • • 未来的发展方向 :虽然 MGX 目前的能力范围主要集中在小型项目上,但 MGX 的开发团队一直在致力于不断迭代和升级产品,逐步扩展 MGX 的能力。未来,MGX 将会具备处理更复杂商业软件开发项目的能力,比如大型企业级应用、复杂的电商平台等。这将为用户提供更广泛和强大的软件开发解决方案,满足不同用户的需求。 

MGX 背后的 MetaGPT 原理



 

智能体

 

学术界和工业界对术语“智能体”提出了各种定义。大致来说,一个智能体应具备类似人类的思考和规划能力,拥有记忆甚至情感,并具备一定的技能以便与环境、智能体和人类进行交互。

智能体运行周期流程图

在MetaGPT看来,可以将智能体想象成环境中的数字人,其中

智能体 = 大语言模型(LLM) + 观察 + 思考 + 行动 + 记忆

这个公式概括了智能体的功能本质。为了理解每个组成部分,让我们将其与人类进行类比:

  • • 大语言模型(LLM):LLM作为智能体的“大脑”部分,使其能够处理信息,从交互中学习,做出决策并执行行动。
  • • 观察:这是智能体的感知机制,使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
  • • 思考:思考过程涉及分析观察结果和记忆内容并考虑可能的行动。这是智能体内部的决策过程,其可能由LLM进行驱动。
  • • 行动:这些是智能体对其思考和观察的显式响应。行动可以是利用 LLM 生成代码,或是手动预定义的操作,如阅读本地文件。此外,智能体还可以执行使用工具的操作,包括在互联网上搜索天气,使用计算器进行数学计算等。
  • • 记忆:智能体的记忆存储过去的经验。这对学习至关重要,因为它允许智能体参考先前的结果并据此调整未来的行动。

多智能体

多智能体系统可以视为一个智能体社会,其中

多智能体 = 智能体 + 环境 + 标准流程(SOP) + 通信 + 经济

这些组件各自发挥着重要的作用:

  • • 智能体:在上面单独定义的基础上,在多智能体系统中的智能体协同工作,每个智能体都具备独特有的LLM、观察、思考、行动和记忆。
  • • 环境:环境是智能体生存和互动的公共场所。智能体从环境中观察到重要信息,并发布行动的输出结果以供其他智能体使用。
  • • 标准流程(SOP):这些是管理智能体行动和交互的既定程序,确保系统内部的有序和高效运作。例如,在汽车制造的SOP中,一个智能体焊接汽车零件,而另一个安装电缆,保持装配线的有序运作。
  • • 通信:通信是智能体之间信息交流的过程。它对于系统内的协作、谈判和竞争至关重要。
  • • 经济:这指的是多智能体环境中的价值交换系统,决定资源分配和任务优先级。

一个例子

智能体工作示意图

这是一个简单的例子,展示了智能体如何工作:

  • • 在环境中,存在三个智能体Alice、Bob和Charlie,它们相互作用。
  • • 他们可以将消息或行动的输出结果发布到环境中,同时也会被其他智能体观察到。
  • • 下面将揭示智能体Charlie的内部过程,该过程同样适用于Alice和Bob。
  • • 在内部,智能体Charlie具备我们上述所介绍的部分组件,如LLM、观察、思考、行动。Charlie思考和行动的过程可以由LLM驱动,并且还能在行动的过程中使用工具。
  • • Charlie观察来自Alice的相关文件和来自Bob的需求,获取有帮助的记忆,思考如何编写代码,执行写代码的行动,最终发布结果。
  • • Charlie通过将结果发布到环境中以通知Bob。Bob在接收后回复了一句赞美的话。

MetaGPT: 多智能体框架

使 LLM 以软件公司的形式工作,协作处理更复杂的任务

软件公司多角色示意图
  1. 1. MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等
  2. 2. MetaGPT内部包括产品经理 / 架构师 / 项目经理 / 工程师,它提供了一个软件公司的全过程与精心调配的SOP
    Code = SOP(Team) 是核心哲学。我们将SOP具象化,并且用于LLM构成的团队
    遵循软件开发流程SOP的智能体,真实世界的人类团队进行协作

 


 

MGX 的价值

1. 小项目的价值

  • • 赋能个人和小团队 :正如短视频平台赋予了个人记录和分享生活的能力一样,MGX 也致力于让更多人体验到编程和软件开发的乐趣。通过 MGX,个人和小团队可以轻松地开发出自己的网站、应用和游戏,而不需要具备专业的软件开发知识和技能。这为个人和小团队提供了更多的创新和创业机会,让他们能够将自己的想法和创意转化为实际的产品和服务。


  • • 提高工作效率 :MGX 的高效性和便捷性,可以大大提高个人和小团队的工作效率。例如,一位文科学生,通过 MGX,可以在短时间内开发出自己的网站和游戏,而不需要花费大量的时间和精力去学习编程知识。一位销售经理,可以在短短 30 分钟内,将产品材料和客户需求结合起来,创建一个交互式网页,比传统的 PPT 展示更加生动和吸引人,客户也非常兴奋。这些例子都充分说明了 MGX 在提高工作效率方面的巨大优势。

2. 无需软件开发或编程知识

  • • 简单易用 :MGX 的一大特点是无需用户具备任何软件开发或编程知识。你只需要通过自然语言描述你的需求和想法,MGX 的Agent团队就会为你处理所有的实施工作。这种方式极大地降低了软件开发的门槛,让更多人能够参与到软件开发的过程中来。例如,一位教师,通过 MGX,可以轻松地将自己的教学计划转化为一个精美的网页,而不需要担心自己不会编程。


  • • 专业指导 :如果你本身具备一定的技术背景和专业知识,你还可以从专业角度指导 MGX 的Agent团队,让他们能够更好地理解你的需求和意图,从而为你提供更符合你期望的开发结果。例如,你可以为Agent团队提供一些技术建议和指导,帮助他们选择更合适的技术方案和开发工具,从而提高开发效率和质量。

3. 如何选择和使用不同的Agent

  • • 自动分配 :在使用 MGX 时,你只需要将你的需求和想法告诉团队领导 Mike,他就会根据你的需求,自动分配合适的团队成员来处理。这种方式非常方便,你不需要担心如何选择和使用不同的Agent,只需要专注于描述你的需求和想法即可。例如,如果你想要开发一个网站,Mike 会根据你的需求,分配 Product Manager Emma 来负责需求分析和产品规划,Architect Bob 来负责网站的架构设计,Engineer Alex 来负责网站的开发和实现,Data Analyst David 来负责网站的数据分析和优化等工作。
  • • 直接 @ 提及 :如果你对每个Agent的专业领域比较熟悉,你也可以直接在输入框中 @ 提及他们,让他们来完成特定的任务。这种方式可以提高工作效率和针对性,让你能够更好地控制开发过程。例如,如果你对网站的架构设计有特定的要求,你可以直接 @Architect Bob,让他来负责网站的架构设计工作。

 

展望未来

当前,MGX的产品形态借助标准操作流程(SOP)这一人类社会广泛采用的组织形式,将各个AI Agent有序整合。这些Agent通过自适应协作,或在特定阶段与人类协同作业,共同推进工程项目的高效完成。随着行业的持续迭代与进化,MGX有望在不远的将来逐步演进为一个高度智能化的“AI Society”。

在这个未来社会中,不仅有项目招标与需求定制,甚至可能出现 Agent “人才市场”。客户可以像面试人类员工一样,对Agent进行评估与选择,挑选出最适合的Agent“上岗”,开启一个全新的智能化协作时代。

 




也许 AI Society 不远了。你会期待吗? ?


 

 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

和创始人交个朋友

回到顶部

 

加载中...

扫码咨询