AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI AgentOps新格局,行业最全AI Agent代理工具地图,请及时查收!
发布日期:2024-05-15 07:11:59 浏览次数: 1785



点一下这里“蓝色字”,就可以获取更多即时AI资讯哦!



Prosus是一家国际性的投资控股公司,起源于南非的Naspers集团,并于2019年在荷兰阿姆斯特丹交易所独立上市,公司专注于技术和消费品领域的投资,拥有一个多元化的投资组合,包括对全球多家知名科技公司的重要股份,如腾讯 (Tencent) 、Mail.ru、Delivery Hero、BYJU'S、Flipkart 等。

Prosus AI团队致力于利用尖端的人工智能技术,解决他们服务的20亿用户所面临的现实挑战。在探索通用人工智能(GenAI)的进程中,AI代理(Agent)技术展现出了巨大的潜力。该团队已经成功开发并测试了多款AI代理,这些代理在多种场景下提供服务,如对话数据分析、教育辅导,以及在食品杂货订购、电子商务和二手市场交易中提供智能化的协助。虽然打造高效的AI代理并非易事,但一旦这些代理投入应用,它们将极大地提升用户体验,并带来前所未有的价值。

本文为大家分享下Prosus AI团队在AI代理开发过程中积累的经验和洞见,以及他们构建的代理和工具生态系统(AgentOps Landscape)的详尽介绍。



什么是代理

在探讨代理系统时,对这些系统的本质有一个清晰的共识是至关重要的。一般来说,代理系统是能够根据用户的一般指令独立做出决策和执行任务的人工智能系统。这些系统通常由以下四个核心组成部分构成:

功能强大的大型语言模型(LLM),它能够准确把握用户的意图,并基于目标及代理系统能够利用的工具制定行动方案。

工具,它们为大型语言模型提供了额外的功能,包括网络搜索、文档检索、代码执行、数据库整合等,甚至可能包括其他人工智能模型。这些工具使得代理系统能够执行如创建文档、执行数据库查询、绘制图表等操作。

记忆系统,它不仅能够访问相关数据库等长期记忆资源,还能在完成行动计划所需的多个步骤中保持对特定请求信息的短期记忆。

反思与自我批评能力:更为先进的代理系统还具备识别并纠正在执行行动计划过程中可能出现的错误的能力,能够重新确定步骤的优先级。

例如他们开发的Toqan代理系统,它代表了向更高能力(自主性)系统迈进的一步。Prosus AI团队正致力于深入理解这些系统,并不断推动如何使它们既实用又安全。

代理系统的复杂性可以根据工具的种类和质量、所使用的大型语言模型(LLM),以及对代理系统生成的工作流程所设置的约束和控制措施的不同而有所差异。下面这张图是对单轮聊天机器人与两种不同复杂度的代理系统的对比(从LLM到代理的演进过程)。

在单轮聊天机器人中,用户提出一个问题,机器人给出一个预设的答复。这种交互是线性和有限的,缺乏深层次的理解和连续性。

相比之下,代理系统则更为先进和复杂。它们不仅能够理解用户的指令,还能根据用户的意图和可用工具自主制定行动计划。代理系统拥有强大的语言处理能力和决策制定能力,能够执行更复杂的任务,如进行网络搜索、检索文档、执行代码、整合数据库等。

此外,代理系统还具备学习和自我优化的能力。它们能够根据执行过程中的反馈,不断调整和优化自己的行动计划,以提高效率和准确性。

这张图表标题是"The Evolution from LLMS to Agents",描述了从单一任务的简单模型,到可以执行多步骤问题解决的模型最终发展为可以规划和执行复杂任务的智能体的演化阶段:

1. LLMs (大型语言模型 Large Language Models):

功能:简单的、特定任务的机器学习模型,通常是单一功能、不包含复杂的决策或推理能力。

使用情景:适用于单一任务、不需要多样性决策的场景。

示例:类似于ChatGPT 3.5,即生成器模型。

2. LLM with tools (带有工具的大型语言模型):

功能:大型语言模型(LLM)可以利用信息检索、外部知识库等工具来提升性能,从而解决较为复杂的任务。

使用情景:适用于需要搜集额外信息或使用外部工具来增强响应质量的场景。

示例:类似于ChatGPT with a web browser interface。

3. LLM to planning and actions (从LLM到规划和行动):

功能:模型更加复杂,用来完成特定任务不仅能够进行决策,还能进行规划和执行行动。

使用情景:适用于需要根据信息实施行动、进行复杂决策和专业知识应用的场景。

示例:类似于调用API执行任务 Toqan.ai。



我们为什么创建代理系统

开发代理系统的初衷是为了解决现有人工智能助手的局限性。目前,大多数人工智能助手的功能仅限于执行单一指令的任务,例如“概括这篇文章的内容”或“完成这段代码编写”。

而代理系统则展现出了完成更为复杂、多步骤任务的潜力,例如:“帮我挑选一双最好的跑鞋并购买”、“分析这份年度报告,提供这家公司增长潜力的分析”或“包括我们自己的内部收入数据,提供一份可穿戴设备市场的综合报告”。代理系统与普通助手相比,其对同一基本请求的响应能力有着显著的差异。

更详尽的答案本身就足以成为开发代理系统的充分理由。此外,代理系统还能显著提升结果的质量,这一点已被业界专家Andrew Ng所证实。下图(编码基准测试)展示了使用具备代理功能的GPT3.5在一项复杂的编程任务中,轻松超越了体量更大的模型GPT-4(当前最强大的模型之一——。而如果仅使用GPT3.5模型,其在同一任务上的表现则明显不及功能更强大的GPT-4。



为什么代理系统还没广泛应用?

然而,这自然引出了一个问题:既然代理系统如此先进,为何我们还没有在所有的人工智能交互中应用它们呢?尽管取得了一定的进展,但要完全发挥配备大型语言模型(LLM)的AI代理的潜力,这条道路仍然充满挑战,这些挑战对于构建既实用又可靠的代理系统构成了不小的障碍。这些挑战主要可以归纳为三个方面:技术准备度、代理系统的扩展性,以及工具和集成的复杂性。

技术准备度:尽管人工智能技术发展迅速,但要实现代理系统在复杂任务中的高效运作,现有的技术基础仍需进一步成熟和完善。

代理系统的扩展性:随着用户需求的增长和多样化,如何保证代理系统能够稳定地扩展功能,以满足更广泛的应用场景,是一个亟待解决的问题。

工具和集成:为了使代理系统能够与现有的技术环境和工作流程无缝对接,需要开发更加强大的工具和更加流畅的集成方案。



代理系统在特定领域和任务集上的机会

代理系统在针对特定领域或任务集构建时,往往能够展现出更优异的性能。随着技术的不断进步,Prosus AI团队对于为特定任务和行业量身定制的代理系统充满了期待。这些系统有望提供精准的解决方案,应对特定的挑战和需求,同时解决在代理系统开发过程中遇到的一些问题。例如,Prosus AI团队开发了一个专门用于辅助会话数据分析的代理系统,使得组织内的成员不必掌握数据库查询技能,也能轻松访问内部数据。

快速获取适时的信息以支持基于事实的决策制定非常重要,因为数据往往分散在内部数据库中,通常需要数据分析师通晓数据源并编写查询语句来提取所需数据,但实际工作中这个流程非常的繁琐。然而,有了专注于数据分析等特定任务的代理系统,信息检索、数据库访问、信息相关性评估以及信息综合回答用户问题等任务都变得简单了许多。Prosus AI团队在开发Toqandata分析师代理时正是采用了这种策略。以下是该代理的工作流程:

用户提出查询请求,Toqandata代理接收并解析这些请求。

代理利用先进的数据分析工具,快速搜索和访问内部数据库中的相关信息。

代理评估并筛选出最相关的数据,确保提供的信息对用户决策具有实际帮助。

代理将搜集到的数据进行综合分析,形成简洁明了的回答,反馈给用户。

通过这种方式,Toqandata代理不仅提高了数据的可访问性和可用性,还极大地提升了组织内部的信息处理效率,使用这个可扩展的框架,还可以将特定高影响力用例的答案准确性从约 50% 提高到 100%。



代理运营(AgentsOps)才是未来?

正如前文所述,构建代理系统并非仅是对一个强大的大型语言模型(LLM)进行简单的提示工程——尽管模型训练的持续进步,例如新增的函数调用功能(允许调用外部工具)以及功能更强大的LLM(能够进行推理和规划),确实是实现代理系统的关键。要创建一个高效的代理,需要开发一系列工具供代理使用(如编写与执行代码、网上浏览、数据库的读写操作)、构建执行环境、与现有系统进行集成、实现规划与自我反思等功能。

这些代理系统的复杂性催生了AgentOps(代理运营)的概念,它成为了一个至关重要的焦点领域。AgentOps的目标是通过提供一系列预先构建的能力和工具,降低构建和扩展AI代理的技术门槛,这些工具可以灵活组合,从而简化创建更先进、更高效的代理系统的流程。对于致力于代理开发的人员来说,密切关注AgentOps的发展动态至关重要,这有助于把握技术进步的脉搏,从而为AI代理赋予更强的能力和更广泛的应用范围。

在开发Toqan及其他基于代理的系统过程中,Prosus AI团队经常面临解决复杂的技术难题并寻找合适的工具来构建他们的系统,基于之前的经验,Prosus AI团队与Prosus Ventures团队合作,整理出了AgentOps领域的概况指南,以突出Prosus AI团队所考量的一些工具——详见下图,这份指南可以为对代理开发感兴趣的其他人士提供有用的参考和帮助。



AI代理的发展只是刚刚开始

尽管对于那些正在开发这些系统的我们来说可能并不明显,但AI代理技术目前仍处于起步阶段。实现构建有效且广泛应用的自主AI代理的目标,仍是一条充满不断探索和创新的道路。在努力解决将这些代理系统产品化的复杂性和挑战的同时,它们带来变革性变化的潜力愈发显得清晰可见。需要深入理解当前的技术格局,根据代理系统的专业领域进行分类,并持续关注AgentOps的进展,一起期待在自主AI代理领域即将到来的激动人心的技术突破。

AI代理的发展只是刚刚开始,随着技术的不断进步和应用场景的不断拓展,它们在未来人工智能领域中的作用和影响力将会日益凸显。随着AgentOps等工具和平台的发展,AI代理的构建和管理将变得更加高效和便捷,这将进一步推动自主AI代理技术的发展和应用。在这个过程中,我们一起继续见证AI代理如何以其独特的方式,为各行各业带来深刻的影响和变化。



市场前景

除了对AgentOps工具的调查,Prosus AI团队还为现有代理商开发了一个市场前景,以说明新兴的生态系统,一起可以为其他有兴趣追随代理人的人提供有用的指导。

更多AI即时资讯抢先看

感谢你的关注哦!




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询