微信扫码
与创始人交个朋友
我要投稿
自ChatGPT推出以来,许多第一波生成性AI应用已成为使用检索增强生成(RAG)模式在文档语料库上进行聊天的变种。虽然有很多工作在使RAG系统更加健壮,但不同的团队开始构建下一代AI应用的外观,集中在一个共同的主题上:智能体(Agent)。与用户在开放式文本字段中输入并无需额外输入即可获得结果的大型语言模型的零次提示不同,智能体允许更复杂的交互和编排。特别是,智能体系统具有规划、循环、反思和其他控制结构的概念,这些结构充分利用了模型固有的推理能力来端到端完成任务。结合使用工具、插件和函数调用的能力,智能体被赋予了执行更通用工作的能力。当问题定义明确且不需要来自其他智能体角色或用户的反馈时,单智能体架构表现出色;而当需要协作和多条不同的执行路径时,多智能体架构更倾向于蓬勃发展。
AI智能体定义:AI智能体被描述为能够规划和采取行动以在多轮迭代中执行目标的语言模型驱动实体。
单智能体与多智能体架构:AI智能体架构可以由单个智能体构成,也可以由多个协同工作的智能体构成,以解决特定的问题。
智能体角色(Agent Persona):每个智能体被赋予一个角色或个性,这包括特定于该智能体的任何指令。角色还涉及智能体可以利用的工具的描述。
工具(Tools):在AI智能体的上下文中,工具指的是模型可以调用的任何功能,允许智能体与外部数据源交互。
单智能体架构:由一个语言模型驱动,独立完成所有的推理、规划和工具执行。单智能体模式没有来自其他AI智能体的反馈机制,但可能包括人类提供反馈的选项。
多智能体架构:涉及两个或更多的智能体,它们可以利用相同的语言模型或不同的语言模型集合。每个智能体通常有自己独特的角色。
垂直与水平架构:多智能体架构被进一步细分为垂直和水平两种类型。垂直架构中有一个智能体作为领导者,而水平架构中所有智能体平等参与,共享信息和任务。
智能体的三个组成部分:根据文中的定义,智能体由“大脑、感知和行动”三个基本部分组成,以满足智能体理解、推理和对其周围环境采取行动的最小需求。
图3:展示了RAISE方法的图表
图4:AutoGPT+P方法的图解
THE LANDSCAPE OF EMERGING AI AGENT ARCHITECTURES FOR REASONING, PLANNING, AND TOOL CALLING: A SURVEYhttps://arxiv.org/pdf/2404.11584.pdf
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-01
2024-08-13
2024-04-25
2024-04-26
2024-03-30
2024-05-10
2024-05-28
2024-07-25
2024-04-12
2024-05-06