微信扫码
和创始人交个朋友
我要投稿
导读 本文将分享蚂蚁集团 agentUniverse 团队在泛金融场景,对多智能体的应用与实践。
1. 背景知识
2. agentUniverse 框架
3. agentUniverse 框架应用
4. 问答环节
分享嘉宾|赵泽伟 蚂蚁集团 agentUniverse多智能体框架架构师
编辑整理|吴叶国
内容校对|李瑶
出品社区|DataFun
01
语言模型技术在前两年问世,我们可以将其视为压缩了海量知识的知识容器,但是其技术特点带来了不可控和不可靠的问题,业内对这一技术的初期评价并不高。然而,2022 年年底,OpenAI 推出了 ChatGPT,这一突破性应用刷新了人们对语言模型的认知。通过对齐训练等技术的不断演进,语言模型已经能够视为一种助手模型,这种模型能够有效地处理问答、摘要,并能够辅助人类提供建议,还具备一定的简单推理和工具调用能力。
尽管如此,通过深入分析可以发现,语言模型本质上是无状态的。大部分背景信息都需要通过 prompt 来驱动,缺乏对多轮对话的支持。如果要在复杂任务场景下满足上下文要求,则需要依赖许多额外的机制。因此,语言模型在应对复杂任务时表现得并不理想。
基于对这一问题的思考,业内逐渐发展出智能体的设计理念和技术。智能体的出现,标志着一种新的方向,它弥补了传统语言模型在复杂任务场景中的不足,并推动了相关技术的进一步发展。
智能体技术的最大特点在于它成功地将原本无状态的模型转变为有状态的状态机。通过智能体技术,模型不仅能够有效地理解周围环境,还能够自主地与工具和知识库进行互动和规划。因此,智能体技术很好地弥补了传统模型在需要规划和思考的复杂场景中的不足。
在智能体技术的推动下,业内已经进行了许多尝试和实践应用。然而,在这些落地过程中,我们发现单一智能体或“单兵作战”的方式在应对复杂场景时效果并不理想。这促使业内逐渐形成了多智能体协同工作的理念,通过结合分布/集中、合作/竞争等协同手段,我们能够在不同的环节和分支中,最大化每个智能体的效率和性能。
这种多智能体协同机制特别适用于解决诸如分析、归因和决策等复杂问题,为相关领域的技术应用提供了新的方向和解决方案。
我们的本职工作主要集中在金融和泛金融领域。正如之前提到的,这些领域对于分析、推理和归因等需求非常强烈。金融产业是一个极为严谨的行业,我们总结出该产业的三个主要特点,这些特点也是目前业内关注并试图解决的难点。
在应对这些挑战时,我们采取了分层的方法。一方面,依靠底层模型将能力对齐与提升;另一方面,通过多智能体与专家框架的能力,将金融领域的 Knowhow 注入系统,确保整体的严谨性和专业性。
02
通过这些实践,我们构建了一个名为 agentUniverse 的技术框架。该框架能够帮助用户构建智能体,并实现多智能体的协同运作,通过专家对齐,将智能体的协同水平提升至领域内专家的水平。在此过程中,我们孵化了许多产品和服务。
agentUniverse 框架可以被视为一个模式工厂与智能体构建系统的结合体。通过一系列智能体和多智能体编排组件,用户可以实现智能体的协同运作,定制 SOP 模式,优化智能体的效果。框架还预置了许多产业内有效的模式和组件,目前已在GitHub 上开源(https://github.com/alipay/agentUniverse),感兴趣的用户可以关注。
从架构上看,agentUniverse 框架的底层设计了一套标准协议,用于连接模型知识和系统 API,这套协议是完全泛化的,除了内置一些已有的像模型、向量库、常用工具 API 外,用户可以将任何模型或私有知识库与接口对接进来。再往上一层,框架还融合了许多社区生态中的前沿框架和技术,通过这些底层能力,提供了智能体搭建的组件,通过这些组件,用户可以构造出标准的智能体。构造出的智能体会在一个统一的 Agent 池中进行管理,并通过多智能体协同的模式将它们有机串联起来。再上一层是 Agent 协作模式工厂,内置了部分成熟的协作模式,如 P-E-E-R 等模式可开箱即用,也可注入企业 SOP。
agentUniverse 最下层提供了标准的服务部署方式,在任何终端或者云端上都可以实现部署;最上层提供了标准的智能体服务化机制,支持标准 HTTP 与 RPC 协议(可适配其他自研通信标准)。
03
在实践中,agentUniverse 框架已落地在蚂蚁集团多个产品中,如支小宝和支小助。支小宝定位于面向大众的理财助理,拥有千万级用户规模。支小助则定位于面向专业从业者的 AI 助手,依托蚂蚁财富的凤凰大模型,目标是确保产品具有金融级的严谨性和专业性,让 AI 像扫码支付一样,走进普通人的日常生活。
支小助是一个面向专业从业者的 AI 助手,可以认为是金融专家知识智能体,它可以从定性和定量两方面去服务于金融专家。
投研支小助通过参考金融分析师撰写的思考框架,模拟人类专家的思维过程,实现了标的分析、宏观分析、市场分析、政策解读、策略建议、报告解读等九大类专业金融分析工作,为投资者提供专业的决策依据。以大事解读为例,当使用者选择上市公司大事解读框架后,支小助首先学习框架中的方法论,并结合对输入问题的理解,先借助多维度策划能力将原始问题细化为多个不同角度的分析步骤,再通过全市场信息收集能力,完成研报、财报、行情数据、新闻资讯和市场主流声音的搜集与提取。最后通过专业的信息整合和推理,产出问题的分析与解读。分析师还可以对上述解读过程进行精细化调整,通过点击策划分析步骤中自定义分析框架,可对投研支小助的思考过程进行增加、删除或调整思路顺序,并触发重新解读,使结果更加符合分析师自身的思路和体系。基于上述的能力,投研支小助能够有效替代浅层次的金融分析工作,使金融分析师更加专注于深层次的创新研究。
在产品服务过程中,我们关注了多个设计要素。
首先,由于金融行业对解读类服务的严谨性要求非常高,因此我们在整个过程中采用了完全白盒化的方式,这些过程可以供专业分析师溯源。
其次,金融行业内部不同分析师的研究框架和思路也不尽相同,因此我们支持分析师干预 AI 决策过程。
最后,为了进一步提升智能体在金融分析场景下的水准,我们内置了九大类框架,包含信息查询、标的分析、报告解读、宏观分析、大事解读、市场分析、政策解读、策略建议、泛金融等,这些框架支持定制,分析师可以将自己的研究体系注入其中。
在报告解读方面,智能体会主动将报告解读过程拆分成若干步骤,对细化的问题进行处理,最后进行分析和产出。
除了定性分析,支小助还支持定量分析。有许多分析师利用支小助的能力进行研究、模型开发或观点产出。
NL2Quant,可以通过定量的能力去实现研报策略的复现,利用智能体的能力可以将研报中的指标和理论结构化,并动态生成相关代码和策略。
此外还有很多金融及相关产业落地的应用场景,如上市公司财报生成和研报生成。现在,这些生成过程已能完全由 AI 控制完成。
我们的核心理念是让机器还原金融场景内金融专家的协作模式,复制人类专家知识。
大模型在理解上下文和泛化推理方面表现出色,但也面临知识陈旧和幻觉等难点。一方面,我们通过知识检索增强技术等手段来应对这些问题;另一方面,通过智能体的协同机制还原专家的协同模式,最终实现高质量的金融任务产出。
在模式的最中间,我们采用了 PEER 范式,通过计划、执行、表达、评价四步,结合上图右侧专家分析框架和左侧金融知识库,完成最终的协同工作。
目前,我们已经与多家机构合作提供实际服务。上图案例是与新京报合作的 ESG 智能分析助手。
这个案例是与央视合作为大学生就业和新闻写作提供辅导服务相关的工作。
04
Q1:agent 是否需要定制训练?
A1:agent 本身不需要定制训练,训练更多是在模型层面进行。也有许多外部案例在使用 agentUniverse 框架时,是利用通用模型在金融场景中落地的,这个需要按照实际情况分析。
Q2:支小宝/支小助是否已经上线?
A2:蚂蚁集团AI金融管家“蚂小财”新版已经升级亮相,并在支付宝 App 内全量对外。同时,蚂蚁财富全新 App 搭载“蚂小财”Pro 版上线灰测。
Q3:报告生成需要多少微调数据,数据格式是什么,问答对格式么?
A3:报告生成需要按照具体场景分析,通用模型基于多智能体机制已经可以达到一定的水准。模型层面我们拥有上千亿的优质语料、百亿级别的特色语料,60 万+的高质量指令集。
Q4:agentUniverse 开源框架在千问大模型基座上的表现如何?
A4:表现很好。千问基座在国产大模型中能力表现出色,大家可以体验一下。
Q5:构建好的金融智能体有哪些难点?
A5:主要有三个难点:一是金融场景信息密集,数据时效性和降噪处理都非常关键;二是金融行业内知识和理论丰富,处理不同理论间的冲突并确定知识边界非常重要;三是输出的内容通常带有决策性,因此如何做好决策工作至关重要。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-07-18
2024-04-30
2024-07-10
2024-11-26
2024-07-04
2024-06-11
2024-06-20
2024-10-30
2024-03-29
2024-05-06