AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


(一)初识AI Agent—以大模型为核心的智能体
发布日期:2024-03-13 11:39:30 浏览次数: 2396 来源: AI产品经理研习与实践

引言

在2018年的开发者大会上,谷歌宣布的一款 AI 助手——Google Duplex,一个通过电话完成实际任务的人工智能系统。它能够进行复杂的对话,并且 完全自主 地完成大部分任务,无需人工参与。当然它也具备自我监控功能,当识别到无法自主完成任务时(例如,安排异常复杂的约会),它会向可以完成任务的人类操作员发出信号 

例如用户让它预约一个商家,Google Assistant就会通过Duplex致电商家来安排预约,在过程中是助手自行与商家的接线员对话,预约成功后再反馈用户已经完成。在预约餐馆的例子中,商家的人类接线员(因英文不好给沟通带来了困难)出了不少错,但是Duplex依然能够应付。

图片

当时这个信息还是挺火的,而负责美业连锁门店业务系统需求的我,收到了老板的提问:“你们不是在做顾客自助预约的功能么,能不能像谷歌这样做到顾客说一句话,就自动执行预约呢?”这样的功能肯定用户体验很好!

那时我只笑笑不说话——这种AI技术,我们自研的可能性可以说为0;而那时候也还没有现在这些大模型和智能体框架。不是我不想,而是不能。

而随着以GPT大模型为代表的人工智能(AI)2.0时代的技术发展,从深度学习、机器学习、自然语言处理到计算机视觉,AI技术不断突破限制,为众多行业带来了革命性的变革,从提供客户服务的聊天机器人到为医疗保健和制造业创建的复杂机器人特别是以GPT、Claude、Gemini等大模型的发布,使得这样的智能助手对于小企业、普通人而言也有了触手可及的可能性。

这,就是本文所要探讨的AI Agent(人工智能代理,也称为AI智能体)。


01

AI智能体概述



尽管ChatGPT、Midjourney、Runway、Pika等原生AI应用非常火爆,微软、谷歌、百度、淘宝等大厂在结合LLM的能力更新迭代自己的产品,很多套壳应用也层出不穷,但LLM的潜力可远远不止于用来生成好的文案、图片和视频,或者用来优化学习、体验、搜索等,它可以被定义为一个强大的通用问题求解器——也就是本文所要探讨的AI智能体


什么是AI Agent



AI Agent 并不是一个新兴的概念,早在多年前就已在人工智能领域有了研究。《人工智能:现代方法(第4版)》一书中,作者表示:

任何通过传感器(sensor)感知环境(environment)并通过执行器(actuator)作用于该环境的事物都可以被视为智能体(agent)。

图片

从这个概念上而言,围棋机器人AlphaGo、苹果手机助手Siri、天猫精灵智能音箱等,都可以理解是AI Agent。

不过,我想要探讨的是一种更先进的、面向未来的人工智能代理——AI Agent旨在理解、分析和响应人类输入,像人类一样执行任务、做出决策并与环境互动。它们可以是遵循预定义规则的简单系统,也可以是根据经验学习和适应的复杂、自主的实体;可以是基于软件的实体,也可以是物理实体。它们被用于各种领域,包括机器人、游戏、虚拟助理、自动驾驶汽车等。这些智能体可以是反应性的(直接对刺激做出反应)、深思熟虑的(计划和决策),甚至具有学习能力(根据数据和经验调整它们的行为)。


AI Agent和LLM、RPA的区别



大语言模型和 AI Agent 的区别在于 AI Agent 可以独立思考并做出行动,和 RPA 的区别在于它能够处理未知环境信息:

图片

与植根于固定参数和训练数据的标准自动化过程相比,AI Agent在不确定的环境中蓬勃发展,在未知的领域中自主导航,并处理大量新数据。它们是智能自动化的新面孔。但AI Agent又不仅仅是智能的——它擅长使用电脑,无论是直接浏览互联网、管理应用程序,还是进行金融交易和控制设备,其功能广泛而通用。

但是LLM/LMM的突破和发展,为AI Agent的实现铺平了道路,这也是为什么ChatGPT发布后关于AI Agent的讨论愈发火热。以大模型为驱动的人工智能代理具有以下优势:

  • 语言交互:它们固有的理解和生成语言的能力确保了无缝的用户交互。
  • 决策能力:大型语言模型具有推理和决策的能力,使其擅长解决复杂问题。
  • 灵活的适应性:代理的适应性确保它们可以针对不同的应用进行调整。
  • 协作交互:代理可以与人类或其他代理协作交互,为多方面交互铺平道路。

GPTs本身也可以是智能体,因为它支持“Action”。例如直接浏览网页(使用webpilot插件):

图片

跨软件发送消息:

图片

自动整理信息(例如根据在线客服对话提取出商机线索入库):

图片

AI Agent 可以类比为自动驾驶的 L4 阶段,距离真正实现仍有差距(或者说,目前的表现还不理想):

图片



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询