微信扫码
与创始人交个朋友
我要投稿
不用担心听到 Agent、智能体、代理这些词就觉得高深莫测,读文本文相信会有收获。本文的目录如下:
1. 主流使用大模型的方式
2. 基于 Agent 的工作流程
3. 使用 Agent 的效果如何
4. 关于 Agent 的四个设计模式
主流使用大模型的方式
相信大多数人在使用 ChatGPT 这种大模型时,方式是这样的:你输入一段提示词,大模型会立即生成答案。
这就像你要求一个人写一篇关于「美食」主题的文章,要求他坐在键盘前,从头写到尾,而且不能删除。毕竟大模型的输出就是一个字一个字的往外蹦,不会发现自己写的内容有错误删除重写。
相比之下,Agent 工作流程是这样的: 同样是让它写一篇关于「美食」主题的文章。
这种有迭代反思的做法会带来显著的改进效果。
吴恩达的团队做了一系列实验,简单来说就是让 AI 去写一些代码并运行,最终对比不同模型和工作流程得出结果的性能,进行一个对比。结果如下:
GPT-3.5 模型:准确率 48%
GPT-4 模型:准确率 67%
GPT-3.5 + Agent:高于 GPT-4 模型的表现
工具使用(Tool use)
当然这只是理想中的工作流程,对于很复杂的工作流其实很难可靠的运行,但是这是一种理念,针对比较成熟的、简短的场景它可能是 Work 的。
多智能体协作,这个就有点恐怖了,类似于之前大火的 AI 小镇。
吴恩达举的例子是开源项目 ChatDev,你可以让一个大语言模型扮演不同的角色,比如公司CEO、设计师、产品经理或测试人员,这些 Agent 会相互协作,共同开发一个 App 或者复杂程序。
虽然不是每次都能成功,但有时确实非常惊艳。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-08-18
当产品经理谈到用LLM Agent构建新一代智能体的时候,他们在说什么?
2024-08-15
对话AI教育从业者们:AI如何解决因材施教的难题?
2024-08-03
工业应用中的向量数据库与知识向量化存储方案
2024-07-25
两大深度学习框架TensorFlow与PyTorch对比
2024-07-17
让生成式 AI 触手可及:NVIDIA NIM on VKE 部署实践
2024-07-16
中文大模型基准测评2024上半年报告
2024-07-16
一文看懂人工智能的起源、发展、三次浪潮与未来趋势
2024-07-14
"自拍" 秒变 "证件照" 看Coze如何实现
2024-05-14
2024-04-26
2024-05-22
2024-04-12
2024-07-18
2024-03-30
2024-05-10
2024-08-13
2024-04-25
2024-04-26