AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


深度解读大模型最火的智能体(Agent)
发布日期:2024-06-02 08:35:15 浏览次数: 1974


前言:Copilot 和 Agent 有没有区别?

上周写了一篇文章,讲大模型两种模式,一种是 copilot,一种是 agent。

(还特别火,6000+的阅读,激烈的讨论,没有看过的同学可以看下。)

大模型 Copilot 和 Agent 有什么区别?

文章出来之后引起了讨论,有同学留言觉得 copilot 和 Agent 没啥区别,核心原因是认为,Copilot是传统软件使用AI 增强,这时被包裹成为copilot,另种形式 Agent 是AI系统(目前常见各种对话)包裹传统系统API,这时称为Agent。这两者没有明显区别,同样的实现逻辑。

其实这个是有误区的。

核心概念区别

Agent 和 Copilot 最核心区别在于是否能自主完成任务并不是是否调用其他能力。类似自动驾驶里面的 L2,L3的区别。agent 也可以包在传统软件里面,是否包,还是独立的,不是这个核心区别。

AI Agent 是一种智能实体,它能够感知环境、进行决策和执行动作。AI Agent 通常具有自主性,能够根据给定的目标或任务,独立地进行规划、执行和反思。它们可以分解复杂任务,自我批评和自我反思,从错误中学习,并改善结果。AI Agent 可以被视为具有一定程度自主性和复杂推理能力的系统,它们可以在没有人类直接干预的情况下完成任务。

AI Copilot,另一方面,通常是指一个通过AI技术赋能的智能助手,它协助人类完成各种任务。AI Copilot 可能在特定领域(如编程、写作、驾驶等)提供帮助,通过与人类的交互来提高效率和创造力。AI Copilot 可能更多地依赖于人类的输入和指导,而不是完全自主地完成任务。

简而言之AI Agent 更强调自主性和独立完成任务的能力,而 AI Copilot 更侧重于作为人类的助手,协助完成特定任务。AI Agent 可能在复杂性和自主性方面更为先进,而 AI Copilot 则更注重与人类的协作和辅助。

讲完概念,今天继续深度下 Agent 的架构,当前问题,业界典型范例给大家参考。

典型Agent 架构

下图是一个典型的 Agent 架构。


一个 Agent 里面核心几大块:

1、大模型:负责思考,给出执行,调用的参数。

2、能力库:外挂的各种能力,比如约会议,查文档都是调用另外的系统完成。

3、历史:主要是记录上下文

4、用户澄清:当前 Agent 比较难脱离人的检查确认,所以一般有这一步用户的确认和修改过程。

5、最终展示:有多种展示形式,卡片式,或者给自然语言展示结果。

接下来看下 Agent 实际的范例和当前存在的问题。

业界 Agent 范例

Copilot 有很多成功的范例,最出名的有 GitHub copilot,Microsoft office 365 copilot。大模型已经成功在编程,文案,创意等方向有不错的实践。

当前智能体 Agent 还处在比较早期的阶段,已经有一些比较明显的成果,当前有些典型的尝试:

  • 角色扮演类:比如英语口语老师,情感分析大师。

  • 创作类:各种营销文案如新媒体文章,小红书文案编写等。

  • 办公类:ppt 自动生成,研究报告生成等。


不过总的来说特别实用的 agent 其实还没有孵化出来。

从另外一个角度思考,大模型是一个全新的领域,,从成熟度角度,可以认为:

GPU > LLM > Agent builder > Agent&Application

越是底层越成熟,也只有底层成熟了才能孵化上层的业务。因此如果要有一个比较不错的 Agent,可能需要成熟的 Agent builder。可能有又有小伙伴想知道都有哪些 Agent builder,后面找时间详解一下业界都有哪些 Agent builder各自特点是什么。

下图是 AI Stack 典型技术栈,给忘记的同学回顾:


当前Agent 存在的问题

人工智能大牛吴恩达是 Agent 的拥趸,先简单回顾吴恩Agent 四范式:

  • Reflection(反思):类似于AI的自我纠错和迭代。例如,AI系统会检查自己编写的代码,并提出修改建议。

  • Tool Use(工具使用):大语言模型调用插件,扩展了其能力。例如,使用Copilot进行联网搜索或调用代码插件解决数理逻辑问题。

  • Planning(规划):AI根据用户输入的任务,拆解流程、选择工具、调用、执行并输出结果。例如,根据一张图片中的姿态生成一张新图片,并进行描述。

  • Multi-agent(多智能体协作):多个Agent协作完成任务,每个Agent可能扮演不同的角色,如CEO、产品经理或程序员。这种模式模拟了现实生活中的工作场景,能够处理复杂系统


Agent大家未来肯定看好,但是 agent 当前还是存在比较多的问题,仍能需要工业界持续去改进。

  • 性能问题

传统互联网产品性能都是毫秒级,调用大模型需要等待的时间较长,一些场景下用户不愿意等待的。

  • 效果问题

纯大模型很难上线,还要套用规则或者其他一些手段补充和弥补

  • 成本问题

业务真实场景下,调用大模型成本还是很高。

  • multi-agent 还没有起来

没有把多个 bot组织起来,快速构建大量的智能体。吴恩达认为多agent 效果会很好,但是怎么组合调用,还没有看到很好的成果经验。

总的来说,前途是光明的,道路还是曲折的。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询