微信扫码
与创始人交个朋友
我要投稿
单体AI代理系统正在逆袭,多代理系统可能要凉凉了?
随着大语言模型(LLMs)的不断进步,越来越多的公司开始构建AI代理系统。
但是,到底什么是基于LLM的代理系统?
我们真的需要多代理系统吗?
前Open Devin(现Open Hands)的Graham Neubig最近发表了一篇博文,深入探讨了这个问题,并解释了如何打造优秀的单体代理系统。
来看看这场"单体VS多体"的AI代理之战!
多代理系统通常会在这些组件上进行变化,以实现不同的功能。
你认为单体AI代理系统会成为未来的主流吗?
【原文译文】
作者: Graham Neubig | 2024年9月26日
最近,“多代理系统(multi-agent system)”成了人工智能领域最热门的流行词之一,不仅是 MetaGPT[1] 和 Autogen[2] 这样流行的开源框架的重点关注对象,也在各种黑客松[3]和诸多研究论文中频繁出现。然而,在这篇文章中,我想从另一个角度来看待这一趋势,并论述为何单一代理系统同样值得关注。文章将以我们构建的软件开发代理框架 OpenHands[4] 的经验为例,阐述相关观点。
本文将讨论以下几点内容:
目前大多数实用的 AI 代理都是基于像 Anthropic 的 Claude[5] 或 OpenAI 语言模型[6] 这样的大型语言模型(LLM)。但仅有语言模型并不足以构建一个完整的代理系统,至少还需要以下三个组成部分:
通常,在讨论多代理系统时,我们至少会在这三个组成部分中的某一个上进行变动。
假设我们正在构建一个 AI 软件开发工具。我们可以参考 CodeR[7]——一个用于 AI 软件开发的多代理框架。CodeR 包含多个代理,这些代理使用相同的底层语言模型,但在提示词和动作空间上各不相同:
reproduce.py
文件中的代码来复现错误。这种系统架构虽然直观,但在实际构建过程中仍然面临诸多挑战。
构建多代理系统时,可能遇到以下几个难点:
有趣的是,很多这些挑战与人类组织的管理问题类似!相信大家都有过这样的经历:所在团队组织混乱、沟通不畅,或者因某个成员离职导致关键技能缺失。
需要明确的是,人们选择多代理系统并非没有原因——在能够为每个代理提供合适的架构和工具时,专业化代理在特定任务上表现出色。那么,单一代理系统能否与之竞争呢?我认为,这个目标比我们想象中更容易实现——我们已经在 OpenHands 中实现的 CodeActAgent[8] 中创建了一个不错的原型。以下是构建优秀的单一大语言模型(LLM)、单一动作空间和单一提示词技术所需的要素。
这是相对容易实现的部分。目前已有一些通用性很强的 LLM,包括封闭的 Claude 和 GPT-4o,以及开源的 Llama-3.1[9] 或 Qwen-2.5[10]。虽然这些模型无法涵盖所有能力,但它们的能力覆盖面非常广泛。即使它们缺少某些特定能力,也可以通过持续训练[11]来增加新能力,而不会显著影响其他能力。
这也不算难。如果我们希望为多个代理提供不同的工具,可以通过以下两种方式来实现:
这一部分相对较为复杂。我们需要确保代理能够获得解决任务的合适指示,并从其环境中获取必要的信息。以下是两种可能的实现方案:
找到最佳解决方案仍然是一个活跃的研究课题,但我相信这是可以克服的挑战。如果你对此感兴趣,欢迎加入 OpenHands 的 Slack 社区[16]与我们一起探讨更多内容!
以上讨论并非否定多代理系统的价值。例如,当某个代理拥有特权信息,或在多个代理分别代表不同用户执行任务的情况下,多代理系统无疑是最优选择!
本文的目的只是希望大家能够对增加系统复杂性的趋势保持批判性思考。有时简单才是最优解。凭借强大的模型、先进的工具和多样的提示词,我们已经朝着这一方向迈出了坚实的一步。
如果你对上述内容感兴趣,可以通过我们的开源项目[17]或在线版本[18]尝试基于单一通用 AI 代理构建的强大开源软件开发工具,或者加入我们的社区[19]并做出贡献[20]!
MetaGPT: https://github.com/geekan/MetaGPT
[2]Autogen: https://microsoft.github.io/autogen/
[3]黑客松: https://medium.com/@kyeg/announcing-the-sthe-first-multi-agent-hackathon-ever-b5e76f534b0d
[4]OpenHands: https://github.com/All-Hands-AI/OpenHands
[5]Anthropic 的 Claude: https://www.anthropic.com/claude
[6]OpenAI 语言模型: https://platform.openai.com/docs/models
[7]CodeR: https://arxiv.org/abs/2406.01304
[8]OpenHands 中实现的 CodeActAgent: https://github.com/All-Hands-AI/OpenHands/tree/main/agenthub/codeact_agent
[9]Llama-3.1: https://ai.meta.com/blog/meta-llama-3-1/
[10]Qwen-2.5: https://qwenlm.github.io/blog/qwen2.5/
[11]持续训练: https://arxiv.org/abs/2402.01364
[12]Anthropic 的提示词缓存: https://www.anthropic.com/news/prompt-caching
[13]分散注意力: https://arxiv.org/abs/2307.03172
[14]基于检索的生成系统(RAG): https://learnbybuilding.ai/tutorials/rag-from-scratch
[15]研究工作: https://arxiv.org/abs/2209.11755
[16]加入 OpenHands 的 Slack 社区: https://join.slack.com/t/opendevin/shared_invite/zt-2oikve2hu-UDxHeo8nsE69y6T7yFX_BA
[17]开源项目: https://github.com/All-Hands-AI/OpenHands
[18]在线版本: https://www.all-hands.dev/join-waitlist
[19]加入我们的社区: https://github.com/All-Hands-AI/OpenHands?tab=readme-ov-file#-join-our-community
[20]做出贡献: http://nds-ai/OpenHands/blob/main/CONTRIBUTING.md
?
?
?
?
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-02
谷歌CEO : 大模型的低垂果实已经被摘完了,如何挖掘大模型的剩余价值?
2025-01-02
“卷王”豆包上桌,压力给到了谁?
2025-01-02
从0到1构建RLHF系统——小红书大模型团队的探索与实践
2025-01-02
喜迎2025,AI Agent技术栈全解析!
2025-01-02
4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密
2025-01-01
年终长文15000字:学习的终结(The End of Learning)——从ChatGPT到未来
2024-12-31
2024年度总结:我们用Chat2API的最后一行代码开启AI Agent之年
2024-12-31
惊喜!Sam Altman确定OpenAI新产品,AGI、Agents、成人模式
2024-05-28
2024-08-13
2024-04-26
2024-08-21
2024-06-13
2024-07-09
2024-08-04
2024-09-23
2024-04-11
2024-07-18