我要投稿

AI Agent面临的挑战

发布日期：2024-04-21 08:28:32 浏览次数： 2731 作者：AIForge

追溯人工智能的发展历程，从简单的对话交互到完成高难度的任务。

Chat与Agent二者的主要区别

Chat与Agent二者的主要区别在于功能和作用范围。 Chat主要通过“大脑和嘴”这样的形式，专注于信息的处理和语言方面的交流。例如，ChatGPT这类系统能够理解用户的问题，并提供有用且连贯的回答，但它不会直接执行任务。相比之下，Agent则像是一个拥有“手和脚”的智能体，不仅能够进行思考和决策，还能够直接执行特定的任务。从一个简单的比喻来看，Chat侧重于“说”，而Agent则侧重于“做”。

随着技术的进步，我们见证了从单纯的AI智能语音助手和智能客服（主要负责交流），到结合AI和RPA技术的AI数字员工（既能交流又能执行任务）的演变。

AI Agent的例子

以项目网址https://github.com/microsoft/JARVIS中介绍的Agent为例，这是一个非常有趣的“模型选择”Agent。它能够将用户的需求分解为多个子任务，并在Huggingface上找到适合的专家小模型去完成这些任务，之后再将结果整合并反馈给用户。这样的AI Agent不仅仅局限于生成文本，它使用大型语言模型作为核心，使其能够进行对话、执行任务、推理，并展示一定程度的自主性。

AI Agent的特点

AI Agent的特点还包括：能够将大型任务拆解成更小、易管理的子任务以高效处理复杂问题；对过往的行为进行自我批评和反思，通过学习自身的错误来改进并提高最终结果的质量；具备短期和长期记忆能力，能够利用外部向量存储和检索技术保持和调用长期信息；使用工具，比如调用外部API获取额外信息；并拥有一整套行动策略，以在不同情境中选择和执行正确的行为，包括记忆检索、推理、学习和编程等。

XAgent的介绍

XAgent是一例与清华大学NLP实验室联合研发的基于LLM的自主智能体。这个智能体被设计为通用型，适用于处理各种任务，旨在创建能够解决任何特定任务的超级智能体，它旨在成为“超级无敌的多边形战士”，而非仅限于某一特定任务的智能体。

生成式AI未来应用的发展方向

随着技术的持续进步和更多实际应用场景的深入开发，Chat和Agent之间的界限将变得越发模糊。我们将见证生成式AI结合了Chat和Agent的优势，进化为既能与用户进行高度个性化对话，又能有效地执行复杂任务的自动化AI系统。这种系统将提供整合性、互补性和多样性的解决方案，极大地丰富和优化人们的日常生活与工作。

项目网址：https://github.com/microsoft/JARVIS - 一个引人注目的“模型选择”Agent典范。它能够将用户的需求分解成多个子任务，进而在Huggingface选择适宜的专业小模型去完成这些子任务，并将处理过的结果回馈给用户。

此外，微软推出的AutoGen agent以其高度可定制和可对话的特性，加之能够在各种模式下工作，展现了LLM、人工输入与工具相结合的强大实力。利用AutoGen，开发者可以为不同的应用定制灵活的对话模式，无论是采用自然语言还是计算机代码。作为一个通用框架，AutoGen支持开发者构建不同复杂度和LLM能力的应用，已在多个领域显现出其应用的有效性。项目地址详见：https://github.com/microsoft/autogen

清华大学NLP实验室与面壁智能等合作推出的ChatDev（Chat-powered Software Development），是一个创新的全流程自动化软件开发框架。ChatDev旨在构建由多智能体协作的虚拟软件公司，当用户提出具体任务需求后，不同角色的智能体将交互式协作，生成包含源代码、环境依赖文档和用户手册等的完整软件。这一技术的发展为软件开发的自动化提供了新的途径，让快速、高效且成本有效的软件开发成为可能，有望在未来替代人工在传统软件开发流程中的大量工作。

面壁智能与清华大学NLP实验室共同开发的XAgent，作为一个基于LLM的自主智能体，旨在自动处理各种任务。该智能体设计为多用途，可应用于广泛场景，其最终目标是成为一种超级智能体，能应对任何特定任务的挑战，从而成为真正的多面手战士，而非只针对单一任务的专用智能体。

AI Agent的崛起

AI Agent的崛起标志着软件开发领域的一刻革命。与传统软件开发不同，这一新范式让自主学习和调优的Agent成为软件运行的大脑。这一变革不仅让开发者重新思考软件的本质，更为创新提供了无限可能。

在https://github.com/geekan/MetaGPT上可找到MetaGPT项目，展示了一个由AI智能体组成的虚拟软件公司在用户定义的编码任务上进行协作的例子。这种新型合作模式将极大地影响软件开发的未来。

比尔·盖茨在他的博客文章《AI is about to completely change how you use computers》中深入探讨了AI Agent在各个领域中的应用潜力，预示了AI在未来生活中的重要作用。

软件架构的转型

AI Agent的崛起意味着软件架构的转型，从面向过程到面向目标的转变。这种转变为SaaS行业提出了挑战，也展现了AI Agent无限域任务处理能力的潜力。Agent-Centric时代的到来将改变整个软件生态系统，包括技术基础设施、商业模式、生活习惯等。

AI智能体协同工作

清华大学NLP实验室开发的ChatDev是一个基于AI的全自动化软件开发框架，凸显了利用AI智能体协同工作制作软件的前景。而面壁智能和清华大学联合开发的XAgent旨在解决各种任务，期望成为一个万能的Agent。

另一个项目，HuggingGPT，通过结合不同AI模型（例如huggingface）来解决复杂任务。而斯坦福的虚拟小镇项目则揭示了未来AI Agent技术需要克服的成本和资源效率问题。

此次发展不仅推动了技术创新，更引发了对于AI和人类劳动之间关系的深层思考，展现出AI Agent成为AIGC终极武器的潜力。

人机协同模式的演化

随着生成式AI技术的发展，人机协同模式正在经历一场深刻的变革。这种变革不仅为个人提供了增强能力的专属智能助理，而且正在改变人与机器的协作方式，带来更加深入的人机融合体验。

从历史的角度来看，人机协同模式大体上经历了三个阶段：

首先是嵌入模式。在这一模式中，用户通过与AI进行文字交流，利用提示词来设定目标，随后AI便协助用户实现这些目标。举个例子，用户可以输入相关的提示词，由AI来帮助创作小说、音乐、3D作品等内容。这里，AI更多地扮演着执行者的角色，而人类则是决策者。
紧接着，是副驾驶模式。在这个阶段，人与AI之间的关系更像是平等的合作伙伴。AI不仅能够为人类提供建议，还可以直接介入工作流程的各个环节。一个典型的例子就是软件编码，AI能够帮助编写程序代码，检测并修复错误，优化性能等。
最后，智能体模式标志着人机协同进入了一个新的阶段。在这一模式中，人类负责设定目标和提供必要资源，如计算能力，然后AI将独立完成大部分工作。人类在这个过程中主要承担监督和评估的角色。这种模式下的AI展现出了更强的互动性、自主性和适应性，使其更接近于一个独立的行动者。

尽管在当前很多应用场景中，AI智能体相比于副驾驶模式尚未展现出显著的效率提升来覆盖增加的成本，大多数AI智能体技术还处于研究阶段。但从智能体记忆、规划、行动和使用工具的功能分析来看，智能体模式比起嵌入模式和副驾驶模式无疑更为高效，有望成为未来人机协同的主导模式。

AI Agent面临的挑战

AI Agent的发展过程中，技术进步与应用实现方面存在着不小的挑战。在技术层面，尽管LLM（大型语言模型）技术有了显著提升，GPT4这样的先进模型在被应用于AI Agent时，仍旧面临许多问题。

技术层面的挑战

首先是当前Agent系统普遍采用自然语言作为与外部组件（如内存和工具）之间的交互接口。然而，模型输出的可信度存在疑问，存在返回格式错误的情况，并且有时会出现对指示不服从的“叛逆”行为。这导致开发者在构建Agent时，必须投入大量资源来分析和处理模型的输出结果。

其次是成本问题，尤其对于多Agent系统来说，费用成了巨大的障碍。以斯坦福的虚拟小镇为例，一个Agent一天的运行成本需要20美元的代币，这主要是因为Agent需要处理大量的记忆和行动决策任务，此成本甚至超出了很多人工岗位。因此，未来Agent技术的进步以及LLM推理能力的提升都需要在降低成本方面进行双重优化。

社会经济挑战

进一步而言，AI Agent的发展还可能带来包括安全与隐私、伦理与责任以及对经济和社会就业的影响等多方面的挑战。特别是在ChatGPT发布成为标志性事件后，全球自由职业平台上的写作和编辑类工作的数量及收入都经历了急剧的下滑，这不仅预示着AI技术的发展将对众多人的职业生涯产生深刻的长期影响，也标志着人类社会需要在伦理、责任、经济与就业等多个维度，对AI Agent的发展进行深入探讨和合理引导。

在AI技术持续发展的背景下，Chat和Agent之间的根本差异在于他们的功能与应用范围。Chat更注重于沟通，而Agent则具有直接完成任务的能力。随着技术的进一步革新，这两者之间的区别正变得越来越模糊。

随着生成式人工智能技术的不断成熟，我们即将迎来一批更加智能、更加自主的AI助手。它们不仅能与我们进行深度交流，还会在我们的日常生活和工作中发挥更重要的作用。正如远方星空中的星辰，虽然距离遥远，它们的光辉却能穿越时空，触动我们心灵的深处，提醒我们在这个由人类与机器共同织就的未来里，继续寻找并维护那些属于人类的独特温度和智慧。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业