微信扫码
与创始人交个朋友
我要投稿
在当今这个智能化风起云涌的时代,随着人工智能技术的飞速发展,大模型(Large Language Models)作为推动行业变革的关键力量,正逐步渗透到日常生活的各种细节。中国作为互联网精英大国,众多科技巨头与新兴企业纷纷布局,不断探索大模型的无限潜能,AI产品飞速迭代,上演着百花齐放的盛况!
但!笔者从开始接触AI,听到的产品“花名”之多都快把我的cpu烧了,豆包、文心、通义、千帆、月之暗面、混元...真好听!但这些名字有的是模型,有的是Agent平台,有的又是智能对话助手,这就算了,有的时候同一个名字,一会儿是说模型,一会儿又是说智能体平台...心疼心疼刚敲开AI之门的孩子吧T0T
不过别怕,笔者在写完这篇文章之后,的确豁然开朗清晰了很多,如果您也有和我一样的对这些产品服务形态的模糊,那请给我个机会给您降降噪,耐心的接着往下这篇文章吧
(这些内容捋了三天呢,真肝和真心一起给大家!❤️)
国内主流大模型、智能助手、智能体平台一览
国内各家AI产品常见服务形式
重点介绍一下上面表格出现的几种智能服务形式
Agent智能体
智能体的英文名是 Agent,是指基于大语言模型有能力主动思考和行动的智能实体,并具有以下特点:
主动思考与行动的能力
智能体不仅能被动地响应指令,而且能够主动进行思考和决策。
感知和理解需求
智能体能够理解用户的需求,这通常涉及到对自然语言的理解。
拆解目标和形成规划
智能体能够将复杂的任务分解为更小、更可管理的步骤,并制定实现这些步骤的计划。
记忆能力
智能体拥有一定程度的记忆能力,能够存储和回忆先前的交互、知识和经验,以此来指导当前的决策和行为。
使用工具和 API
智能体能够利用各种外部工具和应用程序接口(API)来执行任务和访问信息。
决策和行动
最终,智能体能够基于以上过程做出决策并采取行动。
AI对话助手
多功能AI对话助手类产品可以通过其强大的自然语言处理能力与广泛的知识覆盖面,来实时为用户提供高质量的信息反馈,大到专业领域的知识查询,小到日常生活的疑问解答,具备多场景的应用能力。普遍包含以下主要功能:
对话能力:能够准确理解用户提出的问题,支持与用户进行连续的多轮对话,提供相关且一致的回答。
个性化互动:根据用户的交流风格和偏好调整回答方式,识别用户情感状态,调整回答语调和内容。
文案创作与优化:把握不同平台的内容风格,创作符合平台特性和用户需求的文案。
文档阅读与深度分析:大部分AI智能助手支持用户上传PDF并分析大型文件,快速提炼关键信息。
文本到图片生成:部分AI智能助手可以根据用户输入的文本描述生成具有特定风格或情感色彩的图片。
学习辅助工具:辅助用户进行中英文作文写作,提升文章质量和表达的准确性。
高效信息搜索与整合:提供无广告的纯净搜索体验,帮助用户节省时间,直接获取所需资讯。
日常生活与工作规划:根据用户需求制定日常生活和出游计划,提供景点推荐和交通信息。
跨平台应用支持:提供网页端、Chrome浏览器插件、iOS、Android、Mac和Windows端应用程序。
普遍的AI智能对话助手都是通过与用户基于语言对话的方式,来为用户提供便捷、高效和个性化的服务体验。
加菜:对话助手是智能体么?
智能体“Agent”通常指的是能够感知环境并采取行动以实现特定目标的实体。从这个定义来看,对话助理确实可以被视为一种智能代理(intelligent agent),因为它们是能够接收用户输入、理解其含义并生成适当响应的软件系统。然而,与许多其他类型的智能代理不同,AI智能对话助手没有自己的目标或主动性,而是完全依赖于用户的输入来决定如何行动。因此,AI智能对话助手可以被视为一种特殊的智能代理,尽管我可能符合智能代理的一些定义,但功能和行为仍然主要局限于语言理解和生成方面。
智能体是一个广泛的概念,涵盖了能够执行复杂任务的AI系统,而AI智能对话助手是智能体的一种特定形式,专注于通过对话与用户进行交互。随着技术的发展,两者之间的界限可能会变得模糊,许多智能体也会集成智能对话助手的功能。
一站式AI智能体平台
国内一站式AI智能体平台通过提供全面的AI功能和灵活的定制能力,帮助企业和开发者快速构建和部署智能体,以满足不同场景下的需求。AI智能体平台通常集成了多种AI功能和工具,允许用户创建、配置和部署个性化智能体(如聊天机器人、虚拟助手等)的综合性服务平台。普遍包括的能力有:
自定义智能体创建:用户可以根据需求配置智能体的属性、行为和对话流程。
模板和插件系统:提供多种预设模板和插件,方便用户快速开发智能体。
可视化编辑工具:通过图形界面和拖放操作,实现智能体逻辑和对话流程的可视化编辑。
API和集成能力:支持与第三方服务和企业内部系统的API集成。
知识库管理:用户可以创建、编辑和管理自己的知识库,包括添加、删除和更新知识点。
自动化工作流:支持创建自动化工作流,实现任务的自动执行和调度。
多语言支持:支持中文、英文等多种语言的智能体开发。
数据分析和报告:提供智能体交互数据的分析和可视化报告。
发布和部署:部分智能体平台支持将开发好的智能体发布到所需的平台或渠道
常见的配置方式包括:
提示词prompt生成:通过 prompt 编辑的方式,表达意图、提供行为说明,引入数据集、工具等能力,创建智能体。
低代码+可视化方式生成:通过拖拽的可视化方式,对大模型、插件、数据集、工具、代码块等组件进行组合,快捷搭建业务流,完成智能体开发。
各大智能体平台最后输出的个性化智能体普遍都是对应智能体官网的聊天机器人、或可以集成到一些社交媒体平台(如微信公众号、抖音等)的虚拟助手等。
一站式大模型开发及服务运行平台
一站式大模型开发及服务运行平台是一种集成化解决方案,旨在简化大规模预训练模型(也称为大模型)的开发、部署和运维过程。这类平台通常提供一系列工具和服务,使得企业和开发者能够更轻松地利用大模型来解决实际问题,而无需从头开始构建所有基础设施和流程。以下是此类平台的一些关键特点和功能:
模型训练与微调:
提供强大的计算资源和优化的训练框架,以便快速高效地训练大模型。
支持模型微调,允许使用特定领域的数据对预训练模型进行个性化调整,以更好地适应特定场景。
模型部署与服务:
自动化的模型部署流程,确保模型可以从训练环境无缝迁移到生产环境。
提供API接口和SDKs,便于将模型集成到现有业务系统中,提供实时预测服务。
数据管理:
数据清洗、标注和管理工具,帮助准备用于训练和验证的高质量数据集。
安全的数据存储和传输机制,保护敏感信息。
监控与优化:
监控模型性能,包括准确率、延迟等指标,确保服务质量。
提供工具进行模型优化,包括超参数调整和架构改进。
安全性与合规性:
遵守相关法规,提供数据加密、访问控制等安全措施。
支持模型审计,确保模型行为可解释和可追溯。
成本效益:
通过共享资源和优化策略降低模型开发和运行的成本。提供灵活的付费模式,比如按需付费,以适应不同规模的项目需求。
具体到一些知名的一站式大模型开发及服务运行平台,如百度智能云的文心千帆、阿里云的百炼、腾讯云的MaaS等等,它们各自提供了一套全面的工具和服务,以满足不同行业和场景下对大模型的需求。这些平台通过提供一站式的服务,极大地降低了大模型开发和部署的门槛。
一站式轻应用开发与服务调用平台
这类平台允许开发者以较低的技术门槛创建轻量级应用,通常包含低代码或无代码的开发环境,以及丰富的APIs和预构建组件,提供了便捷的方式来开发轻量级应用,并实现服务的调用和集成。它具备低代码开发、模板和组件库、接口管理等功能,使得开发者能够快速构建应用,并轻松调用所需的各种服务。
这类平台提供全面的AI开发工具和资源,包括数据管理、模型训练、部署、测试和监控等,侧重于快速开发和部署轻量级应用,提供更广泛的AI开发功能,不限于智能体或大型模型,同时包括提供全面的AI开发和部署服务。
讲完大的分类,接下来我们来按照对表格的中的产品,以公司的维度,对同厂产出的AI相关产品,再来一个纵向的对比:
字节跳动
豆包(大模型)
https://www.volcengine.com/product/doubao
豆包大模型是由字节跳动自研的大型语言模型,原名“云雀”,是国内首批通过算法备案的大模型之一。在2024年春季的火山引擎Force原动力大会上,字节跳动宣布将云雀大模型统一改名为豆包大模型,并且正式对外提供服务。
豆包大模型家族包含多个不同的模型,以适应不同的应用场景和需求:
豆包通用模型Pro:专业版,支持长文本,具备理解、生成、逻辑等综合能力,适用于问答、总结、创作等多种场景。
豆包通用模型Lite:轻量版,提供更低的token成本和更低延迟,适合对成本有限制的场景。
豆包・角色扮演模型:具有个性化角色创作能力和上下文感知能力,适用于角色扮演需求。
豆包・语音合成模型:提供自然生动的语音合成能力,适合多种情绪和场景的表达。
豆包・声音复刻模型:能够在5秒内实现声音的1:1克隆,支持声音的跨语种迁移。
豆包・语音识别模型:具有高准确率和灵敏度,支持多语种识别。
豆包・文生图模型:擅长对中国文化元素的创作,提供精准的文字理解能力。
豆包・Function Call模型:提供准确的功能识别和参数抽取能力,适合复杂工具调用场景。
豆包・向量化模型:专注于向量检索场景,为知识库提供核心理解能力,支持多语言。
火山引擎还与多家智能终端厂商成立了智能终端大模型联盟,OPPO小布助手、荣耀智慧办公智能助手、小米“小爱同学”,以及华硕笔记本电脑的豆叮AI助手等应用,均已接入火山引擎的大模型服务。
豆包大模型的应用非常广泛,AI对话助手“豆包”、AI智能体应用开发平台“扣子Coze”都是基于豆包大模型,除此之外,豆包大模型也被集成到了星绘、即梦等AI创作工具、互动娱乐应用“猫箱”以及豆抖音、番茄小说、飞书、巨量引擎等50余个业务中。
豆包(AI智能对话助手)
https://www.doubao.com/chat/69770343901698
豆包对话助手是字节跳动推出的一款多功能人工智能工具和免费AI聊天机器人,基于自家研发的豆包大模型构建,在自然语言处理方面具有强大的能力的同时提供更加丰富的多模态交互体验。
关键能力:
可以根据用户的文本描述生成具有特定风格或情感色彩的图片。
类似于AI搜索引擎,豆包能够快速筛选和整合网络上的有用信息,提供无广告的纯净搜索体验。
提供网页端、Chrome浏览器插件、iOS、Android、Mac和Windows端应用程序,确保用户可以在多种设备上无缝使用。
豆包官方提供了多种智能体,如AI图片生成、全能写作助手、学习小帮手、AI漫画生成等,用户可以直接尝试社区用户创建的海量智能体。
用户可以根据自己的需求,直接在豆包上创建具有个性化特征的AI智能体,适应各种特定的使用场景。不过这里的不像在Coze上功能那么多,基本就是基于prompt来创建一个带提示词模板的智能体。
扣子Coze(智能体创建分发平台)
https://www.coze.cn/
字节的一站式智能体创建和分发平台,可以在扣子上快速搭建基于大模型的各类 Bot(扣子上管智能体叫Bot)并将 Bot 发布到各个社交平台、通讯软件或部署到网站等其他渠道。
关键能力:
支持生成单Agent/多Agents两种模式
单 Agent 模式:Bot中只有一个Agent,适用于逻辑较为简单的Bot。
多Agents模式:在一个Bot中设置多个Agent,以处理复杂的逻辑。
无限拓展的能力集:
扣子集成了丰富的插件工具,可以极大地拓展 Bot 的能力边界。
内置插件:目前平台已经集成了近百款各类型的插件,包括资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型。你可以直接将这些插件添加到 Bot 中,丰富 Bot 能力。例如使用新闻插件,打造一个可以播报最新时事新闻的 AI 新闻播音员。
自定义插件:扣子平台也支持创建自定义插件。你可以将已有的 API 能力通过参数配置的方式快速创建一个插件让 Bot 调用。
多家大模型能力选择:
基于Coze创建的智能体不仅可以选择字节自家的豆包,还可以选择其他国内有名的大模型
丰富的数据源:
扣子提供了简单易用的知识库功能来管理和存储数据,支持 Bot 与你自己的数据进行交互。无论是内容量巨大的本地文件还是某个网站的实时信息,都可以上传到知识库中。这样,Bot 就可以使用知识库中的内容回答问题了。
内容格式:知识库支持添加文本格式、表格格式、照片格式的数据。
内容上传:知识库支持 TXT 等本地文件、在线网页数据、Notion 页面及数据库、API JSON 等多种数据源,你也可以直接在知识库内添加自定义数据。
持久化的记忆能力:
扣子提供了方便 AI 交互的数据库记忆能力,可持久记住用户对话的重要参数或内容。
例如,创建一个数据库来记录阅读笔记,包括书名、阅读进度和个人注释。有了数据库,Bot 就可以通过查询数据库中的数据来提供更准确的答案。
自编排的工作流设计:
扣子的工作流功能可以用来处理逻辑复杂,且有较高稳定性要求的任务流。扣子提供了大量灵活可组合的节点包括大语言模型 LLM、自定义代码、判断逻辑等,可以通过拖拉拽的方式快速搭建一个工作流。也可以快速复制别人的工作流
提供对已上架的Bot的数据分析可视化能力
百度
文心大模型(大模型)
https://wenxin.baidu.com/
文心大模型是百度自主研发的产业级知识增强大模型。从单模态大模型到跨模态、从通用基础大模型到领域行业大模型,构建了模型层、工具与平台层、大模型创意与探索社区的完整布局。降低人工智能开发和应用的门槛,已在多个领域得到广泛应用,组成结构如下:
注意到这里面的文心一言,就是文心大模型生态下NLP的智能体产品,其他的模型都是需要应用集成和调用的,而文心一言就直接跳转到了AI对话助手产品页面
文心一言(AI智能对话助手)
https://yiyan.baidu.com/
百度的AI对话助手产品,由文心大模型驱动,是上面文心大模型家族的NLP方面代表。具备理解、生成、逻辑、记忆四大基础能力。当前文心大模型已升级至4.0Turbo版本。具备基本的理解能力、生成能力、逻辑能力、记忆能力。
基础3.5模型免费,4.0+都要收费
文心智能体平台AgentBuilder(智能体创建分发平台)
https://agents.baidu.com/
从0到1创建完整的智能体,拥有独立C端交互界面,可自主配置各类通用能力,为用户提供完整的闭环服务体验。
AgentBuilder更看重的是每个人都能成为智能体开发者,提供零代码、低代码开发模式,支持开发者根据自身行业领域、应用场景,采用多样化的能力、工具,打造大模型时代的原生应用。
同样支持零代码的prompt提示词方式创建智能体。
支持的大模型只有文心模型NLP系列有关的模型 Ernie系列
以及拖拽形式的智能体工作流编排
支持创建数据插件
用户提交已有数据后,即可快捷创建数据类插件;可基于模型对数据的理解和处理能力,为用户提供各类查询服务。
支持创建能力插件
适用于已有各垂类AI能力或模型的开发者,提供该能力的服务域名,即可快捷创建能力类插件;无需重复开发,就可在各流量场景中被调用。
提供百度生态流量分发路径,实现“开发+分发+运营+变现”一体化赋能。支持发布智能体到文心智能体平台的体验中心,既可在C端多流量场景分发,也可面向企业级开发者。
还支持发布到微信公众号、企业微信号。
千帆AppBuilder(AI应用搭建分发平台)
千帆AppBuilder(AI应用搭建分发平台)
https://appbuilder.cloud.baidu.com/
千帆AppBuilder比起AgentBuilder,更多看中的是赋能开发者快速实现AI原生应用搭建,降低AI原生应用的开发门槛,支持企业敏捷、高效地原生应用开发,更多的适用于企业级AI原生应用开发。
通过提供一站式开发套件,包括RAG、Agent以及GBI等应用框架,满足企业敏捷、高效地原生应用开发的需求。
AI原生应用开发平台,支持通过prompt自然语言,完成应用的创建与分发。
支持选择的模型有两种,第一个是思考模型
另外一个是问答模型,可选择范围就相对比较多了(这里走接口吧,一下看的全)
开箱即用的组件与框架,基于官方API/SDK,提供具备强大对话、思考及工具调用能力的Agent应用框架。最新的Assistants API,基于具备理解、规划、反思和进化能力的文心大模型智能体机制,高效地创建、调优我们自己的智能体。
同时还有很多优质的智能体在原生应用商店,供大家选择
千帆大模型平台-ModelBuilder
(大模型开发及服务运行平台)
https://qianfan.cloud.baidu.com/
百度智能云千帆大模型平台是面向企业开发者的一站式大模型开发及服务运行平台。不仅提供了包括文心一言底层模型和第三方开源大模型,还提供了各种AI开发工具和整套开发环境,一站式企业级大模型平台,提供先进的生成式AI生产及应用全流程开发工具链,方便客户轻松使用和开发大模型应用。
功能覆盖大模型全生命周期建设,支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务。
结合API/SDK的方式供企业/个人开发者快速接入到自己的产品中。
加菜:AgentBuilder vs AppBuilder vs ModelBuilder
AgentBuilder更倾向于创建交互式的智能体,强调对话和用户交互体验。
AppBuilder提供了一个广泛的AI应用开发平台,支持从简单到复杂的各种应用开发,包括但不限于智能体。
ModelBuilder专注于模型层面的定制和开发,适合需要特定AI模型能力的高级开发者或企业。
为避免内容过长影响大家消化,我们将这几米长的内容拆成上下两篇,后面对各家AI产品的比对详细内容,还请关注明天的小纸条更文哦❤️
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-21
2024-08-13
2024-04-11
2024-07-09
2024-07-18
2024-10-25
2024-07-01
2024-06-16