AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI智能体的五个级别
发布日期:2024-07-27 20:37:21 浏览次数: 1701


介绍

这是我非常喜欢研究的一个话题。主要是因为我想揭开智能体相关概念的神秘面纱,以及智能体究竟是什么。

此外,我还想在特定领域的实现与广泛、通用的实现(即 AGI)之间建立明确的界限。

考虑到特定领域的实现,这是我最感兴趣的领域,这一类需要考虑可用的构建工具、成本、延迟以及实际和商业影响。所有这些,我都将在本文中一一阐述。

领域考虑因素

关于 AGI 或人工超级智能 (ASI) 以及各组织正在开发的产品,已经有很多炒作、恐惧和猜测。这不是我最感兴趣的,我最感兴趣的是如何利用 LLM 和自主AI智能体的力量,在组织中实现特定领域的应用。

对话式用户界面的主要商业驱动力是银行、零售、金融服务等行业的公司,它们创建了基于人工智能的用户界面,供用户就产品和服务进行交互。

任何能够感知环境并执行行动的实体都可以被视为智能体。

目前所处的阶段

考虑到细分领域的实现,我们目前处于第 2 级和第 3 级;最有可能处于 2.5 级。

LangChain 在创建智能体开发框架方面一直处于领先地位。DSPy 使用其智能体 RAG 方法对 LLM 和 LLamaIndex 进行编程。

这些智能体拥有 50% 至 90% 的成人技能,具有战略任务自动化能力。根据用户输入,智能体可以分解用户描述,规划子任务,并以有序的方式执行这些任务,从而得出结论。

这些智能体能够反复执行中间的子任务,直到得出最终答案。

实际案例

考虑以下问题?

谁被认为是 iPhone 之父,他出生年份的平方根是多少?

这是一个相当模糊和复杂的问题,需要经过几个步骤才能得出答案。不仅要完成数学任务,还要检索知识来回答问题。

在这个实际例子中,智能体可以采取以下几种行动:

  1. LLM Math
  2. SerpApi:下面是SerpApi网站的截图。SerpApi 使从搜索引擎结果中提取数据变得可操作。

  3. GPT-4(gpt-4-0314)

下面,请看这个基于 LangChain 的智能体的输出,注意该智能体是如何从思考到行动,再到观察,依次进行,直到得出最终答案,完成整个链条:

在5个等级的智能体表格中,你会注意到 1 级智能体是基于规则的......基于规则的智能体可以有一定的自主性,但在实践中,它们由预定义的步骤组成,这些步骤根据预定义的步骤执行。

下图展示了一种更基于规则的方法,即使用生成式人工智能节点来构建智能体。在本文稍后部分,我将深入探讨为什么基于规则的自动化和一定程度的自主性是企业实施的明智方法。而不是完全自主的智能体方法。

细分领域智能体的基本结构

细分领域智能体的核心是大型语言模型(LLM)。智能体还可以使用一些工具。工具可以具有特定功能,如网络搜索、特定 API、RAG、数学等。

工具用自然语言描述,以便智能体知道在流程的特定阶段使用哪种工具。工具的数量和能力决定了智能体的强大程度。

实际考虑因素

在考虑细分领域的智能体实施时,有一些实际考虑因素需要牢记。

感知

目前,大多数智能体都是虚拟的,通过语音或文本输入进行访问。这些智能体可以进行推理并得出结论,然后反过来用语音或文字做出回应。可以添加多模态元素,让智能体接收图像或视频作为输入,或生成图像或视频作为输出。

不过,一般来说,机器人不具备其他感官能力,如视觉、触觉、运动等。随着机器人技术的发展,将智能体与感官/物理能力相结合将开创一个新时代。

LLM

正如我前面提到的,智能体的核心是一个 LLM,或者更具体地说是一个被调用的 LLM API。智能体会经历多次迭代和 API 调用。需要满足一个单一的依赖关系,因此我认为任何生产智能体的实现冗余都必须构建到智能体核心中。

自托管

LLM 或本地推理服务器是确保正常运行时间的最佳方式。

成本

考虑到向智能体提出的每个问题都要多次查询 LLM,使用商业 LLM API 的成本将非常高昂。

试想一下,成千上万的用户只会加剧成本问题。

延迟

对话系统需要亚秒级的响应,任何复杂的系统(如每次对话都需要在内部执行多个步骤的智能体)都会增加用户体验的总延迟。这可能成为一个难以克服的挑战。

无法得出结论

值得注意的是,目前存在智能体未得出结论或过早得出结论的情况。如果用户可以访问并查看智能体的推理步骤,那么用户的查询可能会通过智能体推理的中间步骤得到满足。在这种情况下,用户可以让智能体停止推理,并告知智能体已经提供了足够的信息。

工具与成本

智能体需要使用工具才能完成任务。可以建立一个共享工具的市场。制作者无需从头开始制作工具,只需选择现有的工具即可。

这些工具可以是免费的,也可以是收费的;工具可以访问收费的应用程序接口。

智能体一词

随着人工智能的发展,"智能体 "一词被用来描述那些表现出智能行为并拥有以下能力的实体:

  • 自主性
  • 反应性
  • 主动性
  • 社会互动等能力

20 世纪 50 年代,艾伦-图灵提出了人工智能领域的一个重要概念--图灵测试,旨在研究机器是否能表现出与人类类似的智能行为。这些人工智能实体通常被称为智能体,是人工智能系统的基础组成部分。

迁移学习

迁移学习涉及利用从一项任务中获得的知识,并将其应用到另一项任务中。

基础模型通常采用这种方法,即首先在相关任务中对模型进行训练,然后针对感兴趣的特定下游任务对模型进行微调。

迁移学习是一个强大的概念,它增加了模型的多功能性,可以根据过去的学习执行从未见过的任务。

结论

不知何故,自主AI智能体目前被忽视了,但它代表着技术的关键进步。

配备人工智能的智能体具有yi'xia以下能力:

  • 独立运行
  • 做出决定
  • 在没有人类持续干预的情况下采取行动

未来,自主AI智能体将彻底改变从医疗保健、金融到制造和运输等各个行业。

然而,在决策过程中还需要考虑问责制、透明度、道德、责任和偏见等问题。

尽管存在这些挑战,自主AI智能体的未来仍大有可为。随着技术的不断发展,这些智能体将越来越多地融入我们的日常生活。

- END -



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询