AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


聊聊通义千问实验室多Agent框架——Qwen-Agent
发布日期:2024-09-05 11:05:45 浏览次数: 1688


概述

原先写过一篇  聊聊基于AutoGen多Agents框架带来的产研技术思考  的文章,在这里面,基于AutoGen框架,评估了一下我个人认为的多agents框架的功能点。

Qwen-Agent[1]是一个开发框架。开发者可基于本框架开发Agent应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力。本项目也提供了浏览器助手、代码解释器、自定义助手等示例应用。

功能对接

标准对接

对于各个开放平台的线上对接模型,其实没什么好说的,因为都是第一标准。其次就是看兼容OpenAI接口协议的API服务的完善程度。

一个合格的开源框架对接OpenAI接口协议的API服务是基本的功能,可惜这项功能一定会落后于各个开放平台的线上对接功能。因为优先级和侧重点完全是不一样的。

基本功能

对于基本功能的对接,参考 agent[2] 文档即可。在多agent协作、上下文衔接等基本功能。

Tools & RAG

tool[3]一文阐述的比较清楚,而且示例也算不错。比较的能解决一些外部工具调用的问题。

对于RAG的支持,则是在 RAG Example[4] 中讲述的蛮清楚,提供了doc_qa[5]多种案例的示例。

Qwen-Agent支持超长上下文的RAG回答,类似智谱的longwrite-glm4的能力,当然在上下文长度、实现等方面可能会有差别,但最终的效果是差不多的。

与传统的RAG不一样,QWen-Agent的对RAG的实现不是传统的向量数据库+向量分词+向量检索等等组件组合使用;而是直接使用LLM的能力,尤其是QWen LLM。

ReAct & Nest

嵌套查询,QWen-Agent支持嵌套开发和非嵌套开发;通过使用_call_llm(...)_call_tool(...)函数组合来调用LLM和Tool的例子,可以参考ReActChat[6]Assistant[7]的实现。

GroupChat

GroupChat[8] 类。这个类管理一个Agent列表,并自动维护Agent的发言顺序。这个类的特点是:

  • 接收外部输入后,自动协调内置Agent的发言顺序,并依次将发言内容返回给用户;
  • Human-in-the-loop: 将用户也定义为一个Agent,群聊会在必要时要求用户给予反馈;
  • 用户可以随时打断群聊;

examples[9]目录中提供了一个创造群聊和体验群聊的Gradio Demo[10],可以进一步体验群聊功能。利用GroupChat开发可以参考五子棋[11]用例。

小结

大概的过了一遍源码与功能点,还是比较完善的,而且其中的功能点封装的不错,自定义程度很高,当然其功能主要还是prompt在发挥作用。鉴于QWen体系的完善性,还是蛮推荐基于QWen-Agent开发,毕竟各方面很齐全了。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询