微信扫码
与创始人交个朋友
我要投稿
去年年底,OpenAI创始人奥特曼在OpenAI首届开发者大会上预测,未来各行各业,每一个人都可以拥有一个AI Agent。比尔·盖茨也为AI Agent撰写千字博文,称AI Agent将彻底改变人机交互方式,并颠覆整个软件行业。继大模型密集爆发之后,AI Agent风潮又席卷而来。
近期,国内的各科技巨头也纷纷发布自家的AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。未来已来,随着AI大模型的不断“演进”,AI Agent大爆发的时代大幕,已经拉开。
01
AI Agent“寒武纪”,大爆发
1、什么是AI Agent?
AI Agent作为新生事物,尚处于从理论到应用的探索阶段。2023年6月,OpenAI应用研究主管LilianWeng提出:
Agent = LLM + 记忆 + 规划技能 + 工具使用
2024年在红杉资本的人工智能峰会上,吴恩达认为Agent 应该具备四种主要能力,即:反思(Reflection)、使用工具(Tool use)、规划(Planning)以及多智能体协同(Multi-agent collaboration)。
不难看出,业内大佬专家们对AI的理解还是大致趋同的,所谓Agent,我们可以简单理解为一种能够感知环境、自主决策、执行复杂任务的智能实体。在当前阶段,Agent主要以大语言模型(LLM)为核心驱动力,以记忆、规划和工具能力为关键模块。
2、AI Agent,大爆发
在距今5.4亿年前的寒武纪,地球上绝大多数的动物“门”,都开始陆续出现。这一时期持续了两三千万年,并在此过程中出现了大量较高等生物,形成了物种多样性的基本样态,成为地球生命的大爆发时期。类似于寒武纪生命大爆发,BabyGPT、AutoGPT、Generative Agents等实验性产品的陆续问世,让大模型的下半场出现了类似“寒武纪”般的Agent大爆发。所不同的是,寒武纪的生命是碳基生命,而当前的AI Agent(智能体),则是硅基生命。
如同生命的演进,未来的Agent的世界,会有越来越多的应用出现在应用层上。并且会不断升级迭代,“进化”出更加复杂的智能形态。虽然目前来看,Agent能做的还比较有限,但诸如HuggingGPT,在局部模块上已经展示了其使用工具的能力。相信随着技术的不断成熟和进步,Agent必然会像人类的进化一样,最终能够做到思考、执行、并自动解决各种问题。
02
中国VS美国,AI Agent发展现状
1、中国:巨头引领,初创涌动
投资圈流传这样一个说法,“十个AI应用里面,五个办公Agent,三个AIGC”的境况。作为公认LLM落地的最佳载体,Agent在国内的发展势头,可以说是百舸争流,热闹异常。
首先是巨头引领,率先发力。前面提到的钉钉的AI PaaS、百度智能云千帆大模型平台,是以平台模式为主,为中小公司提供基建,类似open AI的GPTs。
AI PaaS 中包含模型训练平台、模型调度平台和插件开发平台 三个部分。最底层具备AI基础设施支撑,第一层开放了各类通用大模型和插件,企业可以通过大模型调取进行调参,打造自己的专属模型;第二层则是模型调度平台,包括上下文记忆、智能规划、模板管理、通用能力和提示工具;运用这两层提供的工具和能力,生态中的企业可以开发出多种多样的AI应用,同时,钉钉还在第三层提供了不同场景应用和行业解决方案。
百度智能云千帆大模型平台,也是由AI基础设施、基础管控平台、通用大模型训练、提示工程、模型精调、Prompt工程等功能构成。它和AI PaaS各有千秋。相较而言,百度的大模型平台的大模型训练,功能更加细化丰富,钉钉则更加注重流程的简化,以此降低用户的使用门槛。
除大厂外,专注应用层的创业公司也都盯紧了Agent。它们往往船小好掉头,尤其是专注垂直领域的企业,更有机会快速创新并推出对应赛道的产品与解决方案。
比如,面壁智能就推出了三款AI Agent产品:XAgent是能够自行拆解复杂任务的超强AI智能体应用框架;AgentVerse是Agent扮演角色彼此互动的通用平台;ChatDev则是一个基于群体智能的AI原生应用智能软件开发平台。再比如,至简天成在2023年推出的1024Code。是以1024PaaS(至简天成全栈自研的云端编程环境)为核心,通用大模型为基座,耗时近1年,所构建的一套自主决策链AI Agent,可以做到编程环境感知,代码编辑,Shell、Console的自主阅读,运行与自主Debug。
2、美国:先发优势明显,场景大爆发
在整个AI领域,美国都拥有明显的先发优势,Agent也是如此,他们不光在技术上更领先一步,在应用场景上也明显更为丰富。比如微软的AutoGen、OpenAI的GPTs,编程的Devin、客服的Agent4、零售的Regie.AI等。
AutoGen允许多个 LLM 智能体通过聊天来解决任务。LLM 智能体可以扮演各种角色,如程序员、设计师,或者是各种角色的组合,对话过程就把任务解决了。
OpenAI的GPTs允许任何人创建一个定制版本的ChatGPT,它可以帮助你学习任何棋盘游戏的规则,帮助教你的孩子数学,或者设计贴纸。任何人都可以轻松地构建自己的GPT,而无需编码知识。
Devin能够规划并执行涉及数千个决策的复杂工程任务,在每一步中都能回忆起相关上下文,并能随时间推移学习并纠正错误,它不仅能够自动完成任务,甚至在几分钟内就能自行编写整个应用程序。
Agent4可以理解自然语言,与用户进行流畅的对话,根据用户的需求和偏好,提供个性化的服务。可以接听各品牌技能话务,能够按照知识库及时准确回答客户,为客户提供标准服务,还能够快速掌握公司的新政策、新业务。
Regie.AI可以创建自定义销售序列,编写高度个性化的电子邮件,并存储相关的销售内容。它还与领先的销售参与平台(如 Outreach.io、SalesLoft和Hubspot)集成,减少了将消息传递到市场并初显成效所需的时间。Regie.AI可以很好地用于零售和电子商务,为用户塑造与核心零售目标和目标相一致的定制且数据丰富的购物体验。
03
AI Agent离我们还有多远?
1、“大脑”还不完善
在AI领域,大模型被视为Agent的大脑,“多模态大模型+Agent”也被认为是通往AGI的可行路径。Agent可以通过不断学习,来适应处于变化状态的应用环境,既能胜任已知多模态任务,还可以快速应对未知的多模态任务。但与此同时,人们还对Agent抱有更高的预期,希望它能具有真正意义上的的创造性,通过对环境的自主探索,发现新的策略和解决方案。
但现实是,目前的大模型“大脑”并没有非常完善,还不足以支撑Agent更大程度的发挥。这也是大模型尚未实现AGI(通用人工智能);多模态(图片、视频的识别和生成)还在发展之中(如sora等文生视频大模型,还不够完善)的最大Bug。其主要原因有两点:第一,模型的更新迭代,远比想象的复杂,需要持续大量财力人力的支持,而且更新周期会比较长;第二,数据限制,大模型的训练需要持续不断的获得大量新数据、新知识。但目前大模型的训练,数据主要来源于自有数据,想获得更多外部数据会面临诸多实际困难,这些都会直接或间接的影响大模型的发展。
2、“手脚”还不够强壮
现有网站、App的接口,好比Agent的手脚,一个健康的API生态对于AI Agent的发展至关重要。如果有足够多的网站和App提供了公开的API,并且这些API的设计和使用都遵循一定的标准,那么AI Agent就可以利用这些API来扩展它们的功能和应用范围。例如,一个AI Agent可以通过调用各种API来获取各种类型的信息,从而提供更丰富和个性化的服务。
但遗憾的是目前API生态尚未完善。一方面,许多网站和App并没有提供公开的API,或者提供的API的功能有限,如携程定机票酒店的接口、美团订外卖的接口、滴滴打车的接口等等,能够开放给Agent的接口不够丰富,从而限制了AI Agent的功能和应用范围。另一方面,即使有些网站和App提供了API,但由于缺乏统一的标准,使得AI Agent在使用这些API时,需要花费大量的时间和精力,来适应不同的API设计和使用方式。
3、缺乏Agent通用外部框架
统一的底层开发框架,可以为AI Agent提供共享服务和功能,包括各种工具和库,如用于处理数据的工具,用于训练和测试模型的库,以及用于部署和监控AI Agent的工具等。它可以帮助开发者快速开发和部署AI Agent,而无需从头开始构建所有的基础设施和功能。
如果没有这样一个统一的底层开发框架,那么开发者在开发每一个AI Agent时,都需要从头开始,这就大大增加了开发的工作量和复杂性,从而导致开发成本的提高。例如,开发者需要自己设计和实现AI Agent的各种功能,如理解能力、推理能力、决策能力和学习能力等,这些都需要耗费大量的时间和精力。
4、百花齐放才是春天
在AI Agent的开发领域,目前有一些国内外的大型的平台和公司,已经在进行有效研发并不断推出应用,如国内的钉钉、百度,国外的微软、OpenAI等。但相对于“一(几)枝独秀”来说,形成“百花齐放”的AI Agent健康生态,无疑更为重要。这在客观上需要更多中小型软件服务商参与进来,共襄盛举。
中小型软件服务商由于对特定业务场景的深入理解,他们开发的AI Agent往往能更好地满足用户的需求,从而提高AI Agent的质量。比如,一家专注于电商领域的软件服务商,可能会开发出一个可以根据用户的购物历史和喜好,提供个性化推荐的AI Agent。此外,中小型软件服务商由于规模相对较小,他们在开发AI Agent时,往往能更快地尝试新的技术和方法,从而推动AI Agent技术的创新。
04
AI Agent,革了toB软件的命
1、toB软件生态革命来了
AI Agent正在慢慢改变面向企业(toB)的软件行业。未来的企业,将更多地依赖于集成化的平台,如钉钉、飞书、企业微信等,这些平台提供了一站式的解决方案,包括打卡、考勤、业务流程审批、OA、ERP、CRM等功能。这些功能都“长在”平台上,也就是说,它们都集成在同一个应用或平台中,用户无需离开这个平台就可以完成所有的工作。这样的设计使得用户体验更加流畅,成本更低,效率更高。而这一优势,必然会导致未来独立入口的toB软件越来越少。毕竟,没谁愿意在多个软件之间来回切换,低效、费时又费钱。
2、AI Agent 加速淘汰toB软件
这些加速淘汰的toB软件包括:简单数据分析、标准流程类(OA、业务、营销、财务等)、执行自动类(RPA软件)、轻咨询、传统教育。
1)数据分析类
这类软件可以对企业内部和外部的海量数据进行处理、分析和可视化,帮助企业做出更明智的决策。但随着大模型技术的不断发展,一些AI平台就可以开始提供更加智能化的数据分析和预测服务,从而让这类toB软件相形见绌,面临被取代的窘境。
2)标准流程类
大模型强悍的数据处理和学习能力,可以通过对大量办公数据的学习和分析,自动化处理那些重复性高、规则明确的任务,以此省去简单重复但是耗时耗力的人工处理。因此,跟所有标准化程度高的职业一样,OA(办公自动化)、业务审批流和营销自动化等标准流程类软件同样面临着被取代的风险。
3)执行自动化类
这一类工具(RPA)的主要优势在于能够模拟人类在电脑上的操作,从而在各种重复性高、规则明确的任务中取代人力。例如,在财务领域,RPA可以自动执行账务处理、数据录入、发票验证等任务;在客服领域,RPA可以通过自然语言处理技术实现自动回复客户邮件、处理投诉等任务。但其缺点也很明显,比如无法处理复杂和高度变化的流程,需要人类进行决策和判断的任务也不太适合使用RPA。此外,RPA需要配置和编程,因此可能需要较高的技术门槛和成本。而基于自然语言处理和机器学习技术AutoGPT,可以完美避开这些问题,自动地理解、学习和模仿人类工作,因此可以替代部分RPA产品的功能,并让这一类的自动执行机器人逐渐“失宠”。
4)轻咨询服务软件
这类软件可以帮助企业了解行业动态、市场趋势和竞争状况,提供决策支持。但随着AI技术的发展,大模型提供智能化的行业分析和咨询服务其实更胜一筹,也更加便利。因此在未来,不只软件甚至整个轻咨询行业,都会受到AI大模型的巨大影响。
5)传统教育软件
与传统的线上教育软件,如编程教育、英语陪练等相比,AI具有更明显的优势,比如AI大模型可以自动生成教学方案,提供更加个性化、精准的教学内容,从而减少对人工教学的依赖。
3、三类软件,会越来越好
这三类软件是:复杂业务管理、拥有稀缺数据的、行业管理软件。
1)复杂业务管理软件
ERP、WMS和TMS等复杂业务管理软件在企业中发挥着重要的作用,它们可以帮助企业实现资源的优化配置、进销存的管理和运输过程的监控。但是,复杂业务管理软件往往需要处理大量的数据和复杂的流程,并且需要结合企业的实际情况进行定制化开发。AI技术可以在一定程度上提供辅助功能,但想要做到完全取代,还是很难的。
2)拥有稀缺数据的软件
一些行业类的软件,如精密制造、离散制造等工业类软件,以及新药研发管理软件、设备生产管理软件等行业管理软件,通常需要处理大量的数据和复杂的算法。这些软件中的数据和算法往往是稀缺资源,只有少数企业能够拥有。加上在处理高度专业化的数据和知识方面,人类的专业知识和经验仍然具有重要作用,因此它的门槛相对较高,也难以被AI大模型完全取代。
3)行业管理软件
设备生产管理软件、新药研发管理软件、等行业管理软件,在某些特定行业发挥着重要的作用。这类软件可以帮助企业实现研发、生产、质量、物料等管理的规范化、流程化和标准化。由于不同行业的业务和管理模式差异很大,而且这些软件通常需要处理复杂的行业规则和知识。所以,AI技术很难针对每个行业开发出通用的行业管理软件。
05
toB软件,不出众就出局
1、不出众,就出局
AI大模型正在一步步鲸吞蚕食to B软件的市场份额,这是一个越来越明显的现实。但也并不代表toB软件只能坐以待毙。由于对行业的深入理解,toB软件公司可以根据行业的特性和需求,定制开发AI Agent。这些AI Agent可以更好地满足行业的特定需求(医疗、金融等),提供更加精准和有效的服务。比如,一家服务于医疗行业的软件公司,可能会开发一个能够帮助医生分析病历,提供诊断建议AI Agent,而这是其他“外行”很难做到的。
相比之下,科技巨头如Google、Amazon等,虽然在AI技术上有着强大的实力,但基于时间成本和资源投入成本的考量,他们无法或不愿意深入到每一个特定的行业,去理解该行业的特性、满足该行业的特定需求。而这也正是toB软件行业向死而生的关键路径。
2、打不过就加入
AI发展到今天,有远见的toB软件从业者,一定要树立抱大腿、找大哥的意识。要有打不过就加入的“眼力劲儿”,要充分发挥拿来主义,管你是钉钉AI PaaS,还是百度智能云千帆大模型平台,都要“为我所用”,在这些平台上选择适合自己的模型和算法,快速开发和部署AI Agent,还无需关心底层的基础设施和运维问题。而且这些toB软件,还可以通过服务从平台上获得更多的客户,既增加了营收,还收集了更多的数据,怎么算都合适。世事维艰,生存不易,这样的羊毛薅起来,一点都不丢人。
乔布斯曾经说过:“人们不知道他们想要什么,直到你向他们展示它。” AI Agent正在向越来越多的世人、向各行各业的潜在用户们,展示它们难以匹敌的能力和效率。toB软件行业以及业内人士们,是时候准备做点什么了,与时俱进,薅AI时代的羊毛;或者调整方向,另做选择,都可能是明智之举,总之,大家该动起来,做点什么了。您觉得呢?
号主简介
- END -
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19