我要投稿

AI智能体的五个级别

发布日期：2024-07-27 20:37:21 浏览次数： 2453 作者：Tech For Fun

介绍

这是我非常喜欢研究的一个话题。主要是因为我想揭开智能体相关概念的神秘面纱，以及智能体究竟是什么。

此外，我还想在特定领域的实现与广泛、通用的实现（即 AGI）之间建立明确的界限。

考虑到特定领域的实现，这是我最感兴趣的领域，这一类需要考虑可用的构建工具、成本、延迟以及实际和商业影响。所有这些，我都将在本文中一一阐述。

领域考虑因素

关于 AGI 或人工超级智能 (ASI) 以及各组织正在开发的产品，已经有很多炒作、恐惧和猜测。这不是我最感兴趣的，我最感兴趣的是如何利用 LLM 和自主AI智能体的力量，在组织中实现特定领域的应用。

对话式用户界面的主要商业驱动力是银行、零售、金融服务等行业的公司，它们创建了基于人工智能的用户界面，供用户就产品和服务进行交互。

任何能够感知环境并执行行动的实体都可以被视为智能体。

目前所处的阶段

考虑到细分领域的实现，我们目前处于第 2 级和第 3 级；最有可能处于 2.5 级。

LangChain 在创建智能体开发框架方面一直处于领先地位。DSPy 使用其智能体 RAG 方法对 LLM 和 LLamaIndex 进行编程。

这些智能体拥有 50% 至 90% 的成人技能，具有战略任务自动化能力。根据用户输入，智能体可以分解用户描述，规划子任务，并以有序的方式执行这些任务，从而得出结论。

这些智能体能够反复执行中间的子任务，直到得出最终答案。

实际案例

考虑以下问题？

谁被认为是 iPhone 之父，他出生年份的平方根是多少？

这是一个相当模糊和复杂的问题，需要经过几个步骤才能得出答案。不仅要完成数学任务，还要检索知识来回答问题。

在这个实际例子中，智能体可以采取以下几种行动：

LLM Math
SerpApi:下面是SerpApi网站的截图。SerpApi 使从搜索引擎结果中提取数据变得可操作。
GPT-4（gpt-4-0314）

下面，请看这个基于 LangChain 的智能体的输出，注意该智能体是如何从思考到行动，再到观察，依次进行，直到得出最终答案，完成整个链条：

在5个等级的智能体表格中，你会注意到 1 级智能体是基于规则的......基于规则的智能体可以有一定的自主性，但在实践中，它们由预定义的步骤组成，这些步骤根据预定义的步骤执行。

下图展示了一种更基于规则的方法，即使用生成式人工智能节点来构建智能体。在本文稍后部分，我将深入探讨为什么基于规则的自动化和一定程度的自主性是企业实施的明智方法。而不是完全自主的智能体方法。

细分领域智能体的基本结构

细分领域智能体的核心是大型语言模型（LLM）。智能体还可以使用一些工具。工具可以具有特定功能，如网络搜索、特定 API、RAG、数学等。

工具用自然语言描述，以便智能体知道在流程的特定阶段使用哪种工具。工具的数量和能力决定了智能体的强大程度。

实际考虑因素

在考虑细分领域的智能体实施时，有一些实际考虑因素需要牢记。

感知

目前，大多数智能体都是虚拟的，通过语音或文本输入进行访问。这些智能体可以进行推理并得出结论，然后反过来用语音或文字做出回应。可以添加多模态元素，让智能体接收图像或视频作为输入，或生成图像或视频作为输出。

不过，一般来说，机器人不具备其他感官能力，如视觉、触觉、运动等。随着机器人技术的发展，将智能体与感官/物理能力相结合将开创一个新时代。

LLM

正如我前面提到的，智能体的核心是一个 LLM，或者更具体地说是一个被调用的 LLM API。智能体会经历多次迭代和 API 调用。需要满足一个单一的依赖关系，因此我认为任何生产智能体的实现冗余都必须构建到智能体核心中。

自托管

LLM 或本地推理服务器是确保正常运行时间的最佳方式。

成本

考虑到向智能体提出的每个问题都要多次查询 LLM，使用商业 LLM API 的成本将非常高昂。

试想一下，成千上万的用户只会加剧成本问题。

延迟

对话系统需要亚秒级的响应，任何复杂的系统（如每次对话都需要在内部执行多个步骤的智能体）都会增加用户体验的总延迟。这可能成为一个难以克服的挑战。

无法得出结论

值得注意的是，目前存在智能体未得出结论或过早得出结论的情况。如果用户可以访问并查看智能体的推理步骤，那么用户的查询可能会通过智能体推理的中间步骤得到满足。在这种情况下，用户可以让智能体停止推理，并告知智能体已经提供了足够的信息。

工具与成本

智能体需要使用工具才能完成任务。可以建立一个共享工具的市场。制作者无需从头开始制作工具，只需选择现有的工具即可。

这些工具可以是免费的，也可以是收费的；工具可以访问收费的应用程序接口。

智能体一词

随着人工智能的发展，"智能体 "一词被用来描述那些表现出智能行为并拥有以下能力的实体：

自主性
反应性
主动性
社会互动等能力

20 世纪 50 年代，艾伦-图灵提出了人工智能领域的一个重要概念--图灵测试，旨在研究机器是否能表现出与人类类似的智能行为。这些人工智能实体通常被称为智能体，是人工智能系统的基础组成部分。

迁移学习

迁移学习涉及利用从一项任务中获得的知识，并将其应用到另一项任务中。

基础模型通常采用这种方法，即首先在相关任务中对模型进行训练，然后针对感兴趣的特定下游任务对模型进行微调。

迁移学习是一个强大的概念，它增加了模型的多功能性，可以根据过去的学习执行从未见过的任务。

结论

不知何故，自主AI智能体目前被忽视了，但它代表着技术的关键进步。

配备人工智能的智能体具有yi'xia以下能力：

独立运行
做出决定
在没有人类持续干预的情况下采取行动

未来，自主AI智能体将彻底改变从医疗保健、金融到制造和运输等各个行业。

然而，在决策过程中还需要考虑问责制、透明度、道德、责任和偏见等问题。

尽管存在这些挑战，自主AI智能体的未来仍大有可为。随着技术的不断发展，这些智能体将越来越多地融入我们的日常生活。

- END -

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-05-13

DeepSeek来袭：AI智能客服的三大悖论

2025-05-10

打造智慧客服新引擎：DeepSeek赋能知识管理与坐席协同全景解析

2025-05-10

1.7k星！专为闲鱼平台打造的AI值守解决方案

2025-05-09

关于基于RAG技术的智能客服系统解决方案

2025-05-06

保险行业为什么更需要新一代人工智能大模型客服？

2025-04-30

比起本地化AI部署，更重要的是应用层模型适配

2025-04-30

Freshworks财报透视AI企业应用：职能自动化、AI客服为刚需类别，AI采用仍处于“早期采纳者”阶段！

2025-04-29

基于私域场景的新一代大模型客服可以玩出什么花样？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

2024中国“大模型+智能客服”最佳实践案例TOP10重磅发布

2024-05-08

AI Agent调研--7种Agent框架对比！盘点国内一站式Agent搭建平台，一文说清差别！大家都在用Agent做什么？

2024-07-22

无法拒绝！Deepseek 接入企业微信，打造智能客服，一年省数百万！

2025-02-09

AI+智能客服：大模型可落地的最成熟场景之一

2024-08-09

谈任务型智能客服（传统方案和基于LLM构建）

2024-06-30

如何使用 ChatGPT 免费阅读和分析 PDF 文档

2024-07-14

支小宝：支付宝送给小年轻们的 AI 生活管家

2024-09-07

一周找了五个情感陪伴AI产品聊天，我感到更空虚寂寞了？

2024-10-18

AI+智能客服：大模型可落地的最成熟场景之一

2024-03-31

ChatGPT 搜索引擎上线。 5 分钟后，我看到 google 搜索的两种死亡。

2024-10-16

大家都在问

保险行业为什么更需要新一代人工智能大模型客服？

2025-05-06

基于私域场景的新一代大模型客服可以玩出什么花样？

2025-04-29

为什么一定要做Agent智能体？

2025-04-22

Manus给AI客户服务带来哪些启示？

2025-03-11

企业微信+DeepSeek，能否重构企服生态？

2025-02-26

Decagon：用 AI Agent 解放客服团队，能否成为下一个独角兽？

2025-01-23

智能客服，不再智障？

2024-12-02

对话微博AI幕后团队：靠“已读乱回”爆火后，“评论罗伯特”为什么变聪明了？

2024-11-04

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB