微信扫码
与创始人交个朋友
我要投稿
2024上海WAIC人工智能大会落下帷幕,这场大会无论是从大咖分享还是展会上的各家产品,都能看出国内对于Agent智能体生态的看好。随着大语言模型(LLM)的快速发展,AI Agent在感知、具身和社会属性方面的发展越来越受到关注,也成为了很多企业提高效应用LLM的落地方案。
但是如今国内智能体生态欣欣向荣,作为AI Agent智能体概念的前身以及推动者的GPTs,却要在几天后就要被关停下架了。
为什么GPTs不行了,国内智能体生态却热度不下?国内这些眼花缭乱一站式Agent智能体搭建平台,各家到底差别在哪儿?我们应该怎么选择这些平台创建自己的智能体?大家又是在什么场景下使用智能体呢?
今天小纸条就给大家一一解答以上问题!顺便做个一站式Agent平台的深度测评和对比,拒绝选择焦虑,抓紧躬身入局!
先聊聊Agent的前身:GPTs
近期,微软官网更新了一条“GPT Builder 即将停用”的通知。微软将于 2024 年 7 月 10 日起停止其 Copilot GPTs 服务,同时将删除所有由用户创建的既有 Copilot GPT 及相关数据。
GPTs,是OpenAI(ChatGpt出品公司)在2023年11月发布的功能。允许用户根据自己的需求构建定制化的ChatGPT。简单来说,任何人都可以创建量身定制的GPTs,还可以分享创建的GPTs,让更多人使用它们提升各种场景的使用效率。OpenAI官方对GPTs的定义是——用户为特定目的创建的ChatGPT版本。
要构建一个GPTs也非常简单,不用代码,只需与GPT Builder(OpenAI推出的GPTs创建器)进行对话,并为其提供说明和其他知识,再选择GPTs能够执行的搜索网络、制作图像、分析数据等操作,和国内现在各大智能体平台创建Agent的方式如出一辙,大部分GPTs也都是聊天机器人的形态,还无法实现复杂任务的执行,和国内各大智能体平台产出的也基本一致。
GPTs为何关停,以笔者的认知就不给大家做没必要的分析了,但虽然说GPTs 逐渐过气,国内智能体生态热度却还是居高不下,国内各AI巨头们也都在持续发力——字节的扣子逐步出圈,阿里、百度、腾讯、天工等智能体构建平台百花齐放,使用方式也都如出一辙的prompt提示及workflow工作流模式,给咱们这些个小老百姓看个眼花缭乱...
但是这一个个初级Agent背后的意义却非常大,因为它们的存在证实了Agent连接真实世界的可行性,也证明了AI可以对真实的生活产生有效的帮助。OpenAI通过GPTs让更多人知道了什么是AI Agent,也对Agent智能体主导的AI产品形态的发展起到了关键的作用。
GPTs不行,怎么国内智能体就行?
(以下观点纯属臆测)OpenAI与国内的公司相比,多少缺点对用户日常生活渗透的产品生态。比起咱们国内,Coze背后是字节,文心一言有百度,通义有阿里,混元有腾讯,这些公司都在用户日常生活所能涉及的领域占领了生态位。
(这些大厂可能多少有点FOMO 心理作祟,没All in AI的也基本都AI first了,赶紧上船不想错过AI的这波浪潮)
社交有腾讯,短视频有抖音,搜索有百度,电商购物有阿里。这些大厂只需将AI大模型和AI智能体与这些原有生态系统中的产品相融合,就能真正轻松达到AI对服务人类日常生活的目标。这一点也是笔者在选择智能体平台最看重的指标之一-生态打通。
智能体平台选择的关键-生态打通
强如有全球最领先的大模型的OpenAI,因为缺少对用户日常生活渗透的产品,使用“智能体”还得去OpenAI的官网找到智能体,打开再对话操作,于笔者来讲这也是一个有点“麻烦”的过程。
为什么笔者这么关注智能体的生态?我们自定义的智能体,也是为了在习惯的场景里解决问题和提效,生态就是智能体生存的土壤,如果自定义的智能助理可以直接在我们本来习惯的场景里发布和使用,甚至是挖掘更多的场景,比起每次还要打开一个特定的网页去描述问题,实在不要方便太多,毕竟我们用智能体就是一定程度上在应对“懒”的问题......
大部分国内的AI公司在创建智能体平台时也面临着这样的问题:尽管有很多优秀的智能体,但是大多数需要用户在官网使用,实践下来经常由于麻烦或者想不起来就失去了热情。
但像是通义、混元、豆包(扣子)、文心就没有这样的担忧,因为用户本来就会购物、聊天、刷短视频和搜索。
他们只需要把大模型,以智能体的形态,加入到他们现有的生态中,就会缩短用户使用智能体很大的麻烦步骤。
阿里应该是最早在各产品中加入通义系列大模型,构建全 AI 生态的。从万相实验室、到淘宝问问、到钉钉 AI 助理到面向服务商的阿里云百炼。
百度目前也将AI功能-文心智能体很好的融入到了自家的生态中。几乎所有信息和调查意图的搜索结果前 5 个结果里都有一个看起来可以解决你问题的文心智能体。
腾讯虽然出场晚,但是耐不住背后的生态实在是好,虽然有一些还是[即将]的状态,但是打通这些也是早晚的事儿。
国内主流Agent平台的三种模式
接下来我们要深入测评的这些主流Agent平台,主要搭建的形态为三种模式:生态平台、工具流程、0代码提示词生成。
生态平台比如钉钉,已经把企业的一部分业务承载了上去,用户可以在产品内部的平台上增加个人Agent,基于钉钉提供的大模型的能力去构建智能化的工作助手,直接融入日常工作流程。
工具流workflow则是通过可视化拖拽的方式,搭建一个让智能体流式工作的顺序。workflow通常提供创建Multi-Agent System需要的基础:知识库和工具。工具一般是官方出品的、自由开发贡献的,和自己开发的。知识库就是提供用户上传自己内部的数据供Agent消费。通常基于在这两个基础能力上,再去搭建Chatbot、Agent,或者是多Agent协作的整套工作流。
零代码AI Agent开发平台就是通过用户的提示词来创建智能体。这种无需编程基础的同时也可以做到高度可定制性,提高开发效率,使用场景最多,基本上这些Agent平台可以没有上面两种模式,但是不能没有这种模式。
各平台功能总结与比较
官方GPTs商店:这些平台都有自己的官方GPTs商店,各种插件模型应有尽有。
知识库:知识库这块,每个平台都有自己的特色,内容丰富。
流程图编排:流程图编排功能也基本都有,提供给0代码基础的同学快速拖拽出一个工作流。
多模型支持:部分平台支持多模型,有的只支持自家大模型,但基本都能满足日常需求。
插件调用:插件调用功能,让这些平台的灵活性大大增加。
Prompt配置:Prompt配置这块,每个平台都有自己的独到之处,能满足个性化需求。
这些平台生成的所谓“智能体”
国内这些一站式AI Agent生成平台,包括之前的GPTs,更多还是偏向做AI 聊天机器人的,多少是有点蹭“智能体”的概念,吴恩达教授在红杉演讲强调的智能体的几个特点-反思、规划、环境感知等自我意识其实都没有的,Agent 应该具备感知、规划、记忆和执行等能力,甚至可以模仿人的行为。
由此可见,目前这些智能体平台帮助用户产出的“智能体”,还未达到AI Agent的标准,它们通常通过用户绑定一个领域知识库,和一些角色预置的提示词prompt,有的还可以通过workflow的形式组合多个插件,但最后的形态大多数是一个通过对话来获取文档相关知识的对话助手,是一种初级形态的Agent。
好啦,接下来我们开始正式深入测评一下各家的Agent生成平台。
正式开始之前,先放出笔者整理了四天测评出来的一览图!
国内主流一站式Agent平台深度测评
1.Betteryeah
https://www.betteryeah.com/agentstore
斑头雁智能科技核心团队来自阿里巴巴钉钉创始团队,提供零代码搭建Agent的能力,快速释放大模型的能力,并内置了ChatGLM、阿里通义千问、百度千帆等国内外知名模型。
产品形态:与Coze类似,属于平台型产品。
开发模式:支持单Agent模式和Multi-Agent模式,适用于不同复杂度的需求。
应用场景:主要面向企业级应用,提供AI客服、营销和销售场景的智能化升级解决方案。
来看下官方智能体中心,集中在以下几个类别:全部智能客服、电商、销售、营销、HR、快速上手
可以选择感兴趣的智能体直接在官网进行对话
再来看下创建智能体
支持用户需求描述,智能生成Agent
也可以基于prompt,手动编排
输入prompt后智能关联到了很多的插件
支持工作流的编排
模型支持的非常全,笔者拉到了Betteryeah支持的全部的第三方模型的列表,商用那一栏写否的选不到,其他都可以
测试一下自建的资讯智能体的效果
生态上来看,只能发布到自己的智能体中心,也就是说必须得在Betteryeah的网站上才能使用
2.Coze
https://www.coze.cn
Coze(扣子)是字节出品的AI Bot开发平台,旨在为开发者提供一个强大且易于使用的平台,以便快速构建和部署智能聊天机器人。
中文大模型智能体平台里,扣子无疑是领先者,无论是入场时间,还是智能体编排工具完备度、插件丰富度、支持大模型的种类,发布渠道的多样性。在扣子平台上,无论自家的云雀大模型,还是moonshot等,统统免费使用。用户体验格外突出,日活也是目前几家智能体平台的最大,无论是生态还是体验还是底层能力上都无疑是笔者认为的首选。
顺便说下字节出品的AI智能对话助手-豆包,用户也可以在豆包上直接基于prompt的方式生成自己定制的智能体, 比较亮点的是tts语音技术的融合使得自定义的智能体可以直接与我们对话。相比之下Coze提供的智能体创建方式和流程要更全,豆包就是更快更便捷,更像是一个功能更聚焦的浓缩的Coze,在移动端上使用起来很高效。下面是豆包的智能体中心。
我们下面就拿功能更全面的Coze来测评啦。
产品形态:与Betteryeah类似,属于平台型产品。
开发模式:支持单Agent模式和Multi-Agent模式,适用于不同复杂度的需求。
字节旗下的超级SuperMan:字节跳动这家公司,大家都懂的,它旗下的扣子平台,就像超级英雄一样,功能强大。
丰富的插件和模型配置:官方提供了丰富的内置插件,涵盖文本分析、图像识别等多种功能,开发者可以根据需求选择和组合这些插件。免费OpenAI API(国际版):Coze提供免费的OpenAI API,使得开发者能够利用先进的AI技术而无需自行开发。
来看下Coze的智能体商店,可以看到推荐的基本都是个人贡献的。主要覆盖的类别包括工具类—自媒体创作(短视频、公众号、小红书)、翻译、PPT、做图、写代码;娱乐类—搞笑、角色;生活—旅游、健康生活。
我们来创建一个智能体
输入prompt后,可以帮忙自动优化。插件那里可以选择AI智能解析,关联到需要的插件
也可以自己添加,这里看到的官方出品的就比较多(品质保障),也可以选择自己创建或者使用他人的
可以选择添加工作流,工作流也有自己的生态,大家都可以贡献
还支持添加图像流
除了基本的知识库和对话体验设置,还有记忆能力和比较有特色的语音配置能力
测试一下结果
还可以生成思维导图,挺秀的
秀归秀,但给我的是23年9月的资讯,好笑的是笔者输入了准确的日期重新提问,结果给的还是一样的23年的数据,但应该是笔者设的配置哪里有问题,我们这里先聚焦做能力分析,忽略这些配置上要优化的内容哈= =
再来看看发布,Coze一直以交互优秀备受认可,看着发布前的自动优化,就很讨喜
可以发布到的平台真全呀!(生态是笔者认为最关键的一个选择指标!)
3.百度千帆AgentBuilder
https://agents.baidu.com
百度AgentBuilder是一款智能体开发工具,旨在降低智能体开发门槛,让每个人、每个组织都能够成为智能体的开发者。AgentBuilder是百度推出的三大AI开发工具之一,另外两个工具分别是AppBuilder和ModelBuilder(小纸条之前的文章给大家介绍过各家产品们的区别)。
产品形态:基于文心大模型的智能体平台,也是平台型。
开发方式:支持开发者根据自身行业领域和应用场景选择不同类型的开发方式,提供低成本的prompt编排方式。
功能特点:提供零代码和低代码两种开发模式,适合不同技术背景的开发者
来看下智能体中心大家都在用什么,热门的主要也还是聚焦提效、娱乐、生活、以及实时热点的高考。
公开配置的智能体允许大家复制,其他的就不行咯
来创建一个智能体,支持提示词prompt和workflow工作流
点击零代码创建后,会进入到快速创建智能体页面,可以直接表达你对于想创建的智能体的设定,就是对这个智能体的要求的prompt
支持官方的工具
支持在工具选项中添加官方的精选工具及自定义工具,拓展智能体能力边界,最多支持勾选八个。
精选工具举例:
搜索增强:勾选搜索增强可以让你的智能体具备在线搜索的能力,同时支持个性化元素指定和广告过滤,提升智能体回答的时效性和丰富度。
一格生图:勾选一格生图可以让你的智能体具备百度高品质自然语言文生图的能力,每个访问智能体的账号每天可以免费使用 20 次。
数据可视化:勾选数据可视化可以让你的智能体轻松具备数据分析和生成图表的能力。
前端代码生成:勾选前端代码生成可以让你的智能体具备自然语言直接生成网页代码的能力,同时还可以通过缩略图预览代码效果。
我的工具就是用户自己创建的,私有工具将不会在“仅链接”和“公开”发布的智能体中生效
知识库
支持开发者上传专业领域相关数据来提升智能体回答问题的准确性
在第一次使用时,可以进行数据上传,最多支持同时选中 10 个知识库
还支持商业广告服务
还可以为智能体添加智能数字人的形象ip,打造有沉浸式体验的智能体,在主页拥有数字形象背景,未来据说也将支持用户与配置数字形象的智能体实时通话。
发布到自家的智能体中心,如果公开配置,就可以给别人参考复制。
测试一下自建的资讯智能体的结果
再看一下workflow的产品形态
4.SkyAgents(昆仑万维)
https://model-platform.tiangong.cn
昆仑万维公司推出,天工SkyAgents。
产品形态:先进的AI Agents构建平台。
开发方式:通过自然语言输入和可视化拖拽快速构建AI Agents,深度集成Skywork大语言模型。
应用场景:适用于具体业务场景,能够感知用户意图并采取行动,做出更智能的决策。
介于之前几家介绍都比较详细,各家智能体的交互体验又大差不差,为了大家的阅读体验,后面我们就捡不一样的重点来说啦。
还是先来看下智能体中心,大家都在用什么样的智能体。
可以看出来天工家的智能体分示例Agents与Agent市场,示例应该是官方出品,市场的就是个人开发者贡献的
来看下智能体创建
AI搜索与知识库无法同时使用
提示词没办法自动解析、优化以及关联工具
对话模型只能选择天工大模型
它的基础配置和workflow应该是同时生效的,在规划页就灵活度很高了,Agents组合协作的能力没有上线。模块和工具都是官方出品的,可以自由组合
发布也是只能发布到天工Agent智能体中心
5.阿里云ModelScope-Agent(魔搭社区)
https://www.modelscope.cn/brand/view/agent
产品形态:适配开源大语言模型(LLM)的AI Agent开发框架。
开发方式:支持多模态Agent,包括客户服务Agent、个人助理Agent等。
特点:用户可一键发送指令调用其他AI模型协作,简化了开发流程。
优势:结合低/零代码平台,进一步降低开发门槛,提高效率。
应用场景:适用于多种业务场景,未来将适配更多新增的开源大模型。
开源社区的一个产品,我们来看下创建智能体。
有对话配置和参数配置两个方式,没有看到workflow
支持多种模型
支持最多5和上传的知识库
以及官方的提供的内置插件
还支持集成OpenAPI,OpenAPI是一个规范,用于定义RESTful API(Representational State Transfer,表述性状态转移接口)的结构。这个规范最初由SmartBear Software创建,被称为Swagger规范,之后更名为OpenAPI规范,简单来说就是YAML或JSON格式的API说明文档。
发布前会跟你确认配置的智能体所以依赖的模型的API key,毕竟开源的搭建平台嘛
点击发布推送到创空间
在设置页面里面,填入两个核心变量:
DASHSCOPE_API_KEY:从这里获取
https://help.aliyun.com/zh/dashscope/developer-reference/activate-dashscope-and-create-an-api-key,可得到千问(LLM的API)和万相(文生图API)的key
AGENT_URL:在上一步点击publish中自动获取到的
创建自己的智能体是不让复制的。
设置页面【上线空间展示】即可发布
可以通过 ModelScope-【我的主页】-【我创建的】里找到发布成功的Agent,也可以分享
6.讯飞的星火友伴
https://xinghuo.xfyun.cn/botcenter/createbot
基于星火V3.0的虚拟人格GPTs应用:讯飞的这个平台,是基于星火V3.0打造的,专注于虚拟人格的GPTs应用。
来看看智能体中心,都是官方提供的模板,可以选择基于一个模板进行二次改造
我们来自己创建一个智能体,可以看到支持三种方式
可以关联数据集,也就是知识库的能力。
发布的话,用结构化方式创建的智能体,只能发布上架到自家的智能体中心
再来看看workflow的模式,拖拽并不是那么好用...
worklow模式下支持的工具就会多一些。但是模型只支持自家的模型。
发布的话,编排方式发布的智能体除了发布上架到自家的智能体中心,还可以接微信服务号
7.智谱
https://chatglm.cn/main/toolsCenter
智谱清言出品的Agent生成器,除了基本的别家都有的智能体生成能力,比较特别的是,具备开发能力的创作者可以通过API调用的方式使用智能体。API基本覆盖清言C端页面所有功能,包含文本对话,文生图,图片解读,联网搜索,文档解析,Python代码执行,外部API调用等。
来看下智能体中心的热门智能体,有官方出品的也有个人开发者贡献的。可以看出来智能体还是很跟实时度的,高考志愿填报有关的智能对话助手最近高高在榜,其他的和别家分类基本一致:
工具类:搜索、修图、数据分析、文章改写、标题生成、PPT、流程图
娱乐类:搞笑、角色对话(各种女友)
生活:搭配选择
模型只能基于自家的GLM,自动支持联网能力+AI绘画+代码能力
外部工具能力支持上非常全,可以选择自建API接入和外部工具市场
同样支持用户自己的知识库
发布上支持自家智能体中心、微信公众号,以及笔者第一个看到的API调用支持!通过创作者中心获取api_key及api_secret就可以通过API方式调用创作者自己创建的智能体。
测试下自定义的智能体效果:
8.Dify
官方网站:https://dify.ai/
开源项目地址为:
https://github.com/langgenius/dify
Dify 是一个 LLM 应用开发平台,已经有超过 10 万个应用基于 Dify.AI 构建。它融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎。使用 Dify,可以基于任何模型自部署类似 Assistants API 和 GPTs 的能力。
社区版完全开源。提供gpts, 知识库,工具插件。除了 Langchain外在 Agent 领域 stars 数最高的开源项目,咱们国人做的。
工作流模式如下,知识库、分支、大模型等等该有的能力都有
支持通过可视化的 Prompt 和应用编排工具开发 AI 应用。
支持无缝切换多种大型语言模型,比如OpenAI 的 GPT 系列模型集成,或者与开源的 Llama2 系列模型集成,支持主流的商业模型和开源模型(本地部署或基于 MaaS)。
支持RAG技术,包括各种基于全文索引或向量数据库嵌入的 RAG 能力,允许直接上传 PDF、TXT 等各种文本格式。
工具生态也很好,基于 Function Calling 和 ReAct 的 Agent 推理框架,允许用户自定义工具,所见即所得。Dify 提供了十多种内置工具调用能力,如谷歌搜索、DELL·E、Stable Diffusion、WolframAlpha 等。
还有监控和分析应用日志和性能,使用生产数据持续改进 Prompt、数据集或模型。
如果是具备开发能力的同学,且业务场景相对复杂有了在dify上建立的理解,再去学习Agent框架会顺手很多,比如metaGPT、AutoGen,会发现逻辑都是大差不大的
给开发同学的加菜:Dify vs Assistants API vs LangChain
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-21
2024-04-11
2024-07-09
2024-08-13
2024-07-18
2024-10-25
2024-07-01
2024-06-17