点击上方?名片后,拉你进AI群
本文主要分为三部分:
1. 什么是 AI Agent ?
2. AI Agent 对我们有什么用?
3. AI Agent 是怎么工作的?
其实 AI Agent 这个词是从去年开始慢慢被大家关注,还记得去年比尔盖茨在他的个人博客上说过的那句话么?
他说:在接下来的几年里,Agent 将彻底改变我们的生活方式,无论是线上还是线下。博客原文地址 ? https://www.gatesnotes.com/AI-agents
1、什么是 AI Agent ?
在互联网时代,我们基于 安卓、IOS、Windows 这些平台,可以构建很多软件应用 APP。咱们手机里的这些 APP 都是互联网时代的产物,它可以满足我们的日常需求。我可以用它来买东西,我可以用它来刷视频,我同样也可以用它来学习。每个 APP 都在一些特定场景下能帮助到我们。那么在AI时代呢?我们经常听到的什么什么大模型,就好比互联网时代的平台。但光有大模型也不行,为啥?因为大模型只是基础设施,没有为我们解决具体问题。还得和互联网时代一样要有具体的应用,所以就产生出来了 AI Agent 的概念,Agent 也被说成是AI代理、AI机器人,其实也是类似的意思。AI Agent 其实就是AI时代下的应用,一个 AI Agent 应用就好比你手机里面的一个 APP。这样说你应该能理解了吧?
通过刚刚我们在上面的介绍,你应该多少有些概念了。那么我们接着展开说说,这玩意到底与我们有什么关系?GPT 在回答通用型的问题是没问题的。在垂直、特定的领域,让AI Agent 做你的AI助理其实是可以比GPT更好的。旅游线路推荐场景,AI Agent 你可以设置你的 Agent 调用邮箱、日历、微信、买票、酒店 API协助你,在一个 Agent 中完成所有的事情。以前你完成这些事情需要在多个 App 之间来回切换,对比最优的方案,Agent 可以帮大大缩短流程和帮你提效,而且还是全自动的。另外,比如说写代码,我们用 ChatGPT 写出来可能有几十行代码有 bug。但我们用编程类的 Agent 去模拟人类的开发流程,这样就能减少 bug,更能符合我们的要求。比如,你是一家商业咨询公司,每天有大量的数据表格要处理,不仅要把数据库里面的原始数据做清洗,还要整理整理成表格,接着根据这个表格的数据做统计分析,最后得到一些商业洞察。那么通用的 ChatGPT 是无法满足你的,最理想的方式是使用 AI 的能力,构建属于自己业务的代理机器人 Agent把数据库连接到 Agent,输入你最终想要的洞察问题,过一会这个报告就出来了。甚至可以连接你的手机和邮箱,生成好了自动发送给你。等等... AI Agent 能做的不仅仅只有这些,基本上覆盖到各行各业。听起来很科幻,但已经是确定的未来了。可以说 Agent 是 AI 领域的下一个形态。它让AI仅仅说什么什么东西,进化到了帮你做什么什么事情。
我们先看看人类是怎么工作的?一般都离不开 制定计划、执行计划、检查结果、优化改进。这一套流程不停地循环。当然这也被称为「PDCA循环工作方法原则」结合上面的图片,可以更加清晰了解啥是 PDCA 工作法。那么问题来了,我们前面说过,Agent 是 AI 领域的下一个形态,从教你做,变成帮你做。那具体是帮我们做的呢?其实 Agent 代替人做事情,也是遵守我们上面提到的 PDCA 工作法原则的。Planning 部分,Agent 会把大任务分解成它可管理可执行的小任务。Tools 部分,Agent 会去执行任务,在模型知识不够的情况下,也会去主动调用外部 API 接口,例如说访问本地知识库信息、获取实时信息 等,都是在这个环节实现的。Action 部分,会根据 Tools 部分执行后的结果,进行优化改进,这也是整个 Agent 最重要的环节。就好比我们人做完一件事情后,会反思迭代。Memory 部分,大模型的上下文记忆是有限的,而 Agent 有效地解决了这个问题。每一次的执行 Agent 都会按照要求存储在 Memory 下,方便下次 Planning 部分制定计划时使用。上面我们是基于一个 AI Agent 的原理拆解,多个 Agent 之间也是可以通讯的,就好比我们每个人在处理工作的时候,能协同办公一样。这个我们以后再具体展开讲。大模型就像是 Agent 的大脑。Agent 可以根据人类制定的计划进行拆解和执行,并不停地循环把执行结果进行反馈和调优,最终达到制定的计划目标。可以说,AI Agent 的出现就是为了模仿我们人类的工作模式,来提高生产效率的。