微信扫码
添加专属顾问
我要投稿
CodeFuse-muAgent [1]是蚂蚁CodeFuse团队开发的Mulit Agent框架,其核心宗旨在于简化agents的标准操作程序(SOP)编排流程。
多Agents的核心关键即Agent的交互链路,也即实现SOP的关键。其核心在于如何把上一个Agent的输出给到下一个Agent的输入,其中需要涉及到llm的输出、具体action的执行以及信息的解析处理。
muagent整合了一系列丰富的工具库、代码库、知识库以及沙盒环境,可支撑用户在任何领域场景都能依托muagent迅速搭建起复杂的多Agent交互应用。通过这一框架,用户能够高效地执行和处理多层次、多维度的复杂任务。
其架构图如下:每个技术点的描述如下:
一个完整的多Agent生态,个人觉得,其所需的能力也就是如上的几点。
在Agent层面,提供四种基本的Agent类型,对这些Agent进行Role的基础设定,可满足多种通用场景的交互和使用。所有的Action都由Agent执行。
相比较于AutoGen,其实也差不多,但划分粒度更清晰;尤其是Agent的编排,由专门的agent负责处理;而ReAct的功能,这里也是单独抽出来的Agent,初步来看,比AutoGen对React的支持更强。
辅助生态组件更详尽,区别于AutoGen,Sandbox支持隔离的特性让辅助生态的支持更丰富强大。
多Agent的关键在Agent间的信息交互,因此communication的实现是必不可少的。AutoGen通过结转逻辑,支持信息流转;CodeFuse通过Communication组件独立实现该功能。从实现方式来看,CodeFuse应该支持的更强大。AutoGen是一个summary_method
方法来定义的。
之前没有了解过国内多Agent框架,因为本身也不多;从AutoGen入手对多Agent的了解,再结合CodeFuse的实现来看,多Agent的SOP更具体更模块化,不过其思想也是一致的,关键的组成部件还是那些。
总的来说,如何协调好LLM并来引导它们产生期望的输出,其本质就是将业务问题抽象并拆解到可执行的Prompt,让他们像处理业务问题一样精准执行;而业务的编排执行则由Agent实现,最终是落到了LLM上。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-18
API协议全景图:从REST到MCP的选型指南
2025-09-18
开源Graph Builder:将文档转化为知识图谱
2025-09-18
Parlant:为企业级应用而生的开源LLM智能体框架,打造“AI员工监工”,让LLM可解释、可审计
2025-09-17
苹果 macOS 本地部署最新 GPT-5 CodeX,网友集体抛弃 Claude Code
2025-09-17
腾讯开源了个知识库系统,在飞牛NAS上部署玩玩!
2025-09-17
Qwen3-Next 首测!Qwen3.5的预览版?但为什么我的测试一塌糊涂?
2025-09-17
Microsoft 推出用于更长对话式 AI 音频的 VibeVoice 且开源
2025-09-16
[开源]Docling:AI时代的全能文档处理引擎
2025-07-23
2025-08-20
2025-09-07
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12
2025-07-31
2025-09-17
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13
2025-08-11