AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI Agent酣战:群雄逐鹿,鹿死谁手?
发布日期:2025-01-18 07:09:24 浏览次数: 1526 来源:数据猿





大数据产业创新服务媒体

——聚焦数据 · 改变商业


导语:2025,关于AI Agent的诸多幻象和预言纷至沓来,如何拨开重重迷雾得以一窥真相?

科幻电影《太空漫游》片头,一群刚学会直立行走的人猿捡起了一根兽骨,偶然挥舞了一下手里的棒棒,发现它居然是一件趁手的工具。于是,脑容量尚且不大的原始人类被唤醒了工具意识,靠着工具劳动和狩猎,逐步站上了食物链顶端。

而这灵光一闪的偶然时刻,正是人类进化史上的一个关键节点,那根工具棒棒无疑是开启了人类进化新征程的魔法棒,某种意义上足以撬动地球未来,堪称AI Agent的祖母级版本。2003年,美国宇航局将两辆火星车勇气号和机遇号降落在火星上,它们在没有人类干预的情况下在火星表面航行。

如果从遥远的光年之外俯瞰2025年,可能发现人类又来到了一个进化的关键节点,而AI Agent仿佛正是那根趁手的“兽骨”。AI Agent代表着一个疯狂的未来,充满了无限的可能性和想象力。Meta CEO扎克伯格预言,“未来的AI智能体可能比人类还多,人类将生活在一个有数亿、甚至数十亿AI智能体的世界中。”

2025年有望成为AI Agent商业爆发元年,预测AI Agent的应用市场将达到数百亿美元规模。中信证券发布研报称,AI产业的下一个大阶段拉开序幕,从而带动AI算力产业链从训练端军备竞赛主导进阶到推理端应用、商业循环主导的新周期,AI Agent的崛起正重塑AI产业链。

商业元年开启,AI智能体落地B端


过去几年,当大家都沉迷于ChatGPT的魔力时,OpenAI却推出可执行复杂任务的AI Agent,其将具备博士级别的助手功能。

传说中的AI Agent是何方神圣?OpenAI将“AI Agent”定义为以LLM为大脑驱动,具有自主理解、感知、规划、记忆和使用工具的能力,能自动化执行复杂任务的系统。

如果说,LLM就像一个“超级大脑”,而AI Agent(智能体)不仅有聪明的“大脑”,还有灵活的“手脚”,能像人一样行动,必要的时候还会使用“工具”。它能够让大模型从“Chat(对话)”走向真正的“Act(操作)”。

这种神奇的AI系统,可被称为Auto-Pilot主驾驶,即AI Agent。它代表的是一种未来真正的人机交互方式,AI的角色有了质的蜕变,从被使用的工具跃升为使用工具的主体。

而这种质的演变,将引发人类生产关系如海啸般的深刻变革,人与大量AI实体之间的协同工作模式将变成司空见惯的场景。

在企业应用场景里,许多耗时任务都交给AI Agent——比如,充当“知识过滤器”:快速提炼关键信息,无需自己手动筛选海量数据;“生产力加速器”:协助用户安排日程、管理任务,让人类专注于更重要的工作;“客服神助攻”:帮助企业更快地处理客户咨询、解决问题,大幅提升团队的响应速度。

人类如金蝉脱壳般抽身,具体业务活都被委派给AI来干,自己只需聚焦于企业战略,关键这样做的效果是——企业运营成效还大幅倍增,好不快哉!

据悉,财富500强公司中近70%的员工,已经使用Microsoft365 Copilot中的Agents来处理大量重复性的日常工作。Gartner预测,到2028年,至少有15%的日常工作决策将由Agentic AI自主完成。德勤AI研究院称,AI智能体将改变基础业务模式,实现新的工作、运营和价值交付方式。

AI Agent的使命,是帮助企业构建“人机协同”的智能化运营新常态。在满足企业智能化需求、打通业务场景的过程中,AI Agent正在承接日益复杂的提质增效需求,并强化内外部协同效能,释放组织核心生产力,对抗组织熵增带来的挑战。可以说,AI Agent正是为企业级应用而生,有望在B端落地,逐步释放AI的核心价值。

作为连接用户和服务的“桥梁”,AI Agent将持续进化为通往AGI(通用人工智能)的重要入口。OpenAI描绘了AGI路线图,并指出自己目前处于第一层,接近达到第二层;而第三层才是AI Agent。在“AI腹地”硅谷,据统计至少有100个正经项目在将Agent商业化,近10万名开发者正在构建Agent,几乎每周都有新的Agent公司诞生,可谓创业盛况空前。

AI Agent如此爆火,这样一个颇具想象空间的市场蓝海有多大?

据Research and Market预估,AI智能体的市场规模将从2024年的51亿美元增长到2030年的471亿美元,年均复合增长率为44.8%。如此大的一块诱人蛋糕,让全球大模型创业公司、互联网大厂、软件应用商、硬件厂商都趋之若鹜,试图吃到新的入口红利。

微软在巨头阵营里的首领气质,尤其体现在对企业AI智能体部署的战略押赌中,大手笔布局,抢占了早期领先地位。深谙企业应用为王之道,恰好迎合了企业降本增效的刚需,凭借专业性的知识沉淀得以稳稳落地B端。

从另一个角度而言,AI Agent与B端市场的两厢契合,也源自于长期以来的“数据饥渴症”。众所周知,AI苦于数据和算力已久,当前训练模型需要的海量数据即将枯竭,唯有寻找新的突破口才行。

但是,去哪里寻找货真价实的海量数据?可以说,市场B端就是一个天然的“数据池”。

B端市场沉淀的海量场景化数据集,某种程度上能够缓解AI的“数据饥渴”,并且还都是高质量活生生的真实数据。给AI Agent喂饱了数据,通过模型训练与微调,深化场景体验与模型的耦合程度,从而实现AI Agent嵌入企业客户工作并承载业务逻辑。这种内在的可谓相得益彰。

巨头疯杀,得 AI Agent 者得天下?


2024年下半年,AI Agent争夺战就已经蓄势待发。2025年开年,终于吹响了战斗的号角。海外市场,OpenAI、Anthropic、微软、谷歌等科技巨头强悍布局,将自家Agent实力当作重要筹码。国内市场也狼烟四起,百度、阿里、腾讯一众大厂也使出了杀手锏。

自大模型战演义至今,大家心里都憋着一股劲儿,誓要问鼎AI Agent之巅,寻求杀手级应用成为业界共同面临的核心命题。

这一次,究竟谁能在人机交互新时代拔得头筹,人们拭目以待。

2025年,微软一个里程碑式的动作,就是踌躇满志地宣布,建立全球规模最大的企业级AI Agent生态系统——Copilot Studio平台。

去年11月的“Microsoft ignite2024”全球大会上,微软发布的Microsoft365、Dynamics365等主打产品中集成了大量商用AI Agents,都是为今年Agents的大爆发做铺垫。

老辣的微软深谙企业用户心理,称这些产品就是为企业而生的。M365Copilot的魅力源于更多Agent功能的加持,旨在将AI智能体与人类协作等核心模块相结合,为企业提供全面的客户服务和销售解决方案。去年10月,微软宣布面向 Dynamics 365业务应用平台,开发部署10款AI Agent——服务于企业的销售环节、会计业务以及客户服务等关键领域。

微软战略的核心正是“智能体网格”——这是一套互联系统,各AI智能体间通过相互协作来解决复杂问题。各智能体并非孤立运作,而可以在整个企业之内无缝传递任务、消息和知识。高度关注企业级基础设施、广泛集成以及业务成果本身——而非原始AI功能。所以,微软的优势并不在于任何单一功能,而在于其全面的效能综合发力。

据悉,现已有超过十万家企业使用该平台创建或编辑AI Agent。微软智能体负责人Charles Lamanna认为,这个增长速度和体量远超微软预期。微软允许企业通过这些智能体随意挑选Azure目录所提供的1800种大语言模型(LLM)——这无疑也是克服对OpenAI模型全面依赖的重要举措。

微软的前瞻性还体现在——譬如,安全和治理功能,大多在AI部署完成之后才被纳入考量,但如今这两大要素已被内置在微软的核心架构当中,确保智能体始终运行在企业权限与数据治理框架之内。

谷歌的步伐紧随其后,2024年12月发布了全新多模态大模型Gemini 2.0。在新模型的加持下,谷歌内置了三款AI Agent——“通用大模型助手”Project Astra、“浏览器助手”Project Mariner和“编程助手”Jules。融入智能眼镜的Project Astra,可以流畅对话并理解音视频;内置于Chrome浏览器的Project Mariner可以执行网页端任务;嵌入GitHub的Jules则可以进行编程且整合进GitHub项目当中;还有可以阅读屏幕画面并给出语音提示的Agent。

OpenAI虽是基础模型的领先者,在Agent方面的布局略谨慎。自2024年12月6日以来,连续发布了o1正式版、ChatGPT Pro、强化微调、Sora正式版、Canvas、GPT版Apple Intelligence/Siri;在展现出模型能力提升的同时,重点展示了AI与应用的结合,其中Sora提供了多种编辑工具,向实用视频工具进一步靠拢;Canvas也在代码Copilot的基础上进化到一个完整开发环境;集成了GPT的Siri则有了Agent的雏形。

2025年1月,OpenAI酝酿推出全新AI Agent——Operator,该系统能够自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。Operator在Computer use的基础上进行大幅度创新和应用简化,扩大AI Agent的使用范围和应用场景。

应用为王,Agent向超级智能体进化


从应用场景看,2025年的一个趋势是——将涌现更多的Multi-Agent模式。AI Agent部署将由“单”变“多”,从单一智能体发展到“群体协作”模式,多个Agent扮演不同角色合作完成任务。

譬如,阿里云Mota社区推出的国内首个大型模型调用工具ModelScopeGPT。基于LLM的AI Agent开发框架ModelScope-Agent,可以通过一键发送指令调用Mota社区中的其他人工智能模型,从而实现大大小小的模型共同协作,进而完成复杂的任务。

此外,百度文心智能体平台、腾讯元器、讯飞星火智能体创作中心、通义智能体、字节扣子等都面向B端企业用户提供了智能体创建平台,并添加AI Agent入口。支付宝旗下AI App支小宝、智谱的智能体AutoGLM,通过自主点咖啡、发红包等操作吸引了一大波C端用户。

阿里宣布,未来所有产品将接入“通义千问”大模型,包括天猫、淘宝、钉钉、天猫精灵、闲鱼、盒马等产品,菜鸟中乡村助理、站长助手等AI专家应运而生,全面推动智能化转型。而这与微软的“网格”战略,似乎有异曲同工之妙。

一些硬件厂商也尝到了些许“甜头”,比亚迪的官方智能体上线后,销售线索转化率提升了119%。联想AIPC智能体的互动率提升了89%,销售线索转化率提升了80%。

在智能手机领域,华为Pura70的“小艺”、小米15系列的“超级小爱”,荣耀Magic的YOYO智能体上线。将服务入口整合在了一起,赋予了智能手机完成更复杂任务的可能性。例如,YOYO智能体便具备模糊理解、界面识别、自动执行、一语到位等能力,可以支持单指令系统级任务执行、第三方应用任务执行甚至多应用协调执行等多种模式。

初创公司们也争相推出了各类Agent产品,然而这些打着Agent旗号的产品与真正的Agent相去甚远,在这个AI暴利产业空间里,可谓鱼龙混杂。尽管AI Agent的概念炙手可热,但也有人表示仍是“虚火”。一个毋庸置疑的事实是,AI智能体正在跨过炒作周期,进入企业IT架构的现实应用——而这段转型期,也必然带来各种复杂因素与严苛挑战。

目前让用户产生足够的粘性和坚实的依赖感的AI Agent,其实寥寥无几。想要打造出一款真正成熟的超级智能体,并实现大规模商业化应用,似乎还需要很长一段时间的耐心等待。

关于智能体的探索仍处于初期阶段,这意味着,谁能在这场智能体驱动型业务的转型风口占得先机,谁就能在下一阶段的市场竞争中建立先发优势。随着更多的资源从大模型转向AI智能体,整个AI行业将有望从现在的泡沫性繁荣走向更为稳健的成长。

临近爆点,垂直领域或现杀手级应用?


即使当下尚未产生真正的杀手级应用,但实际上在细分领域,Agent已经有遍地开花之势了。当前,垂直领域的专业Agent正处于爆点,并因其实用性备受资本青睐。YC合伙人、资深投资人Jared指出,垂直领域AI Agent将成为比SaaS大10倍的新兴市场,可能催生出市值超过3000亿美元的科技巨头。

尽管人类所期待的真正Agent——全能助手Jarvis尚未出现,但多个垂直领域的专业Agent暂露头角,将让我们不断获得拥有近似Jarvis的体验,期待更多垂直领域将跑出“种子选手”。红杉合伙人Konstantine Buhler预测,医疗和教育等“高服务成本”领域,将成为AI技术的下一个重要战场。

在医疗领域,Agent可以帮助诊疗和监测患者,IBM Watson Health是一个AI智能体,可以分析医疗数据并推荐治疗方案;在制造业领域,Agent可以优化生产流程,通用电气使用名为Predix的AI智能体实时监控机器,以预测和防止设备故障;在运输业领域,自主AI Agent可以协助路线规划和交通管理,特斯拉的Autopilot有助于安全驾驶;在农业领域,AI Agent可以优化作物生产、监测土壤质量并预测天气模式,约翰迪尔(John Deere)正在使用一种名为See&Spray的AI智能体。

当Agent进入第一个深水区垂直领域,对专业度的要求则更高。直接套用通用模型的Prompt Agent,任务通过率往往不足50%。而专家Agent能够将模型与垂直领域数据、专业业务流程做深度耦合,形成专业度极高的AI Agent。

对于专家Agent这个层面而言,能够产生商业模式的关键取决于Agent在该垂直领域的专业度如何,能否具备显著的降本增效功效。

以工程项目管理领域为例,深圳知合云数智管控平台,将AI与传统工程行业的专业经验融合,实现从项目规划到竣工的“全生命周期”数智化管理。达到成本质量管控精细化、施工进度管控可视化、安全环保管控智能化、全过程信息管理便捷化、项目各方协同协作高效化等目标,推动项目精细化管理程度提高约50%、安全环保隐患降低约90%以上、投资成本节约率约20%。

AI Agent正在深刻影响企业的数字化转型,推动SaaS平台从简单的业务管理工具转变为驱动智能化业务的引擎,将诞生数百万AI智能体推动企业在特定任务上实现更高效的智能化管理。

但不少领域的专业AI Agent依然不够成熟,输出不精确、性能差强人意、用户不信任等问题困扰其落地。所以,短期内商业化最成功的AI Agent,不一定是看起来“Agentic化”最高的产品,而是能够平衡性能、可靠性,以及用户信任的产品。

从用户体验来说,AI Agent的应用还有很大的提升空间。一是交互界面不够好,全自然语言交互会影响交互效果;二是在落地层面,仍需突破的关键点是个性化,根据用户自身的工作模式进行精细化调整,技术层面似乎还远远不够。

随着推理能力的提升,AI Agent能够更好地理解复杂情境和业务逻辑,做出更加合理和高效的决策。例如,在供应链管理中,Agents可以根据历史数据和实时信息,预测库存需求变化,提前调整采购和生产计划,避免库存积压或短缺。

2025年,新一代AI Agents功能将进化得更强大,凭借在记忆、推理和多模态能力方面的进步,以更好的交互方式处理更复杂的工作,提供更加个性化和精准的服务。

通往AGI的入口,诸多难点与痛点待解


AI Agent距离真正的爆发仍有不少要克服的障碍。一个关键的挑战是:缺少一个能够支撑整个生态的操作系统。初创公司/dev/agents计划为AI Agent开发一个类似于Android操作系统的通用平台,试图解决目前AI Agent碎片化的局面。

其它挑战还包括但不限于:如何实现低延迟、带视觉理解的实时反馈;如何构建个性化的记忆系统;如何在虚拟与物理环境都具备执行能力等等。只有当AI Agent从“工具”变成“工具使用者”时,真正的杀手级应用才会出现。

在Agent的构建上,仍有许多悬而未决的技术难题,例如大模型幻觉、长时记忆的前后一致性问题、以及增强多模态的理解能力。为提升大模型记忆力,波形智能研发了名为RecurrentGPT的增强记忆技术解决方案。

AI Agent依赖LLM“黑盒”,本身就存在不可预测性。至今在解决一些逻辑、推理等核心问题上,Agent的能力还偏弱。因此,Agent各模块之间如何配合、多个Agent如何交互、人类与Agent如何互动等方面,Agent技术尚处于早期阶段。

接入Agent后,所有需要处理的业务场景,都会转化成需要底层大模型理解的数据,从而产生高昂的推理成本。斯坦福的虚拟小镇框架开源后,每个Agent一天就需要消耗20美金的Token数,比用人成本还要高。因此,如何控制高昂的调用成本,是摆在AI Agent面前的一大难题。

现阶段一个最关键的制约因素,还是数据质量、数据规模、应用场景不足,AI模型、AI训练数据集、AI场景落地部署,都远远不够。以AI Agent机器人为例,由于缺乏高质量的真实数据,机器人就无从进行训练。

通过互联网数据,机器人的感知已经出现了相当强的泛化,能够更好地理解物理世界。不少厂商通过真实数据和仿真数据结合的方式,将任务过程中的数据 “喂”给大模型。然而,仿真数据还是不够真实,AI Agent在模拟世界能成功,但导入到现实世界就会有一定的失败率。

当前,AI Agent还远未达到数据飞轮的启动时刻,达不到自动驾驶般的普及度,而真实数据的成本极高,需要花长时间积累。数据的匮乏,不仅会影响模型的准确性和稳定性,还制约了其在真实场景中的广泛应用的可靠性。

如何保证用户的数据安全和隐私,也是一大问题,数据壁垒是关键的一堵墙。但构建数据壁垒并不容易,高敏感的私有数据分散且难整合,业务“过程数据”往往非结构化地存储在企业的服务器中,甚至专家的“大脑”中。这就需要给出客户具体的方案,互相建立信任度。不少厂商先从相关业务“冷启动”,完成过程数据的原始积累。

还有,高昂的推理成本如何控制?一个典型案例是,斯坦福的虚拟小镇框架开源后,每个Agent一天就需要消耗20美金的Token数,比用人力的成本还要高。收益是否迈过了成本的门槛仍是未知数,厂家往往最先考虑的不是盈利,而是如何把高昂的推理成本转嫁出去。

腾讯研究院的报告指出,AI Agent面临的问题还囊括安全性与隐私性、伦理与责任、经济和社会就业影响等多个方面。在国内智能算力较为短缺的现状下,由于技术门槛高、资金投入多、商业模式不成熟,AI Agent这个赛道看似风光实则道险且阻。

因此,AI Agent想要真正实现规模化落地,只有扎实做好大模型技术和找到正确的商业化落地路径,才能在未来不被赶下“牌桌”。

文:蒋皓 / 数据猿
责编:凝视深空 / 数据猿


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询