微信扫码
与创始人交个朋友
我要投稿
点击蓝字,关注我们
01
传统场景下,软件的研发主要依靠人,需求沟通、开发、测试、部署等阶段都需要大量人力投入。大模型优秀的代码生成和一定的思维链推理能力,能够激发微服务研发、运维等环节“智能涌现”,重塑软件研发全生命周期。
商业产品包含效果广告(搜索广告,信息流广告)和展示广告(品牌广告,开屏广告)两大类广告产品,以及基木鱼和观星盘、电商等营销工具。为了保障复杂系统的稳定性,业务同学需投入大量人力运维微服务,从而保证业务功能快速交付和线上高稳定性。这些工作包含两类:
平台工程团队面向商业产品打造的 Jarvis 平台,提供了一整套的运维工具包括自动化部署和微服务治理分析能力。但是这些治理工具存在以下问题:
为了提升商业产品维护的效率问题,Jarvis 平台使用 AI 原生应用思维来全新重塑产品形态,革命性提升业务研发运维效率,基于多智能体架构将专家经验内化,大幅降低使用门槛,显著提升微服务维护的效率(包括故障处理和根因定位、架构优化、部署操作等)。
主要有两个关键环节:
02
应用使用JarvisBot 升级到jdk17(全流程对话式交互)
用户要求升级 JDK17;
03
3.1 业界探索
单个AI智能体=LLM+记忆+规划+工具等,参考述上OpenAI理论基础。
多智能体则需要由多个Agent依靠既定SOP互相进行交流,从而保证智能体能够正确的合力完成一个复杂的长程任务。智能体的关键在于SOP,是不同工种技能的关键,能让每一个智能体扮演一个特定角色。
SOP指的是Standard Operating Procedure,即标准操作程序,它提供了执行特定任务所需涉及的角色分工和详细操作步骤,以确保在不同情况下都能保持作业结果的准确性和高效性。SOP 在软件开发、系统维护和团队协作中起着重要作用,有助于确保开发人员遵循最佳实践、减少错误和提供工作效率。
为了解决项目开篇提到用户需求,系统为了快速产出大量的能力,因此经过多次迭代,有了一系列演进:
阶段一:多智能体协作。Agent 之间需要相互调用才能完成复杂的对话目标。但是Agent 的工作存在大量重复,比如几乎所有智能体都需要调用底层的 API agent进行数据查询,诊断的智能体其实也需要大量的优化操作。智能体直接的边界非常不清晰,交互的方式也比较多样,有通过自然语言,有通过直接调用的,非常混乱。
阶段二:智能体协作SOP 标准化。通过标准操作程序(SOPs)编码作为智能体Prompt,指导大模型按照结构化流程工作并协调智能体各个环节,允许具有领域专长的智能体验证输出并减少复合错误,有效避免大模型的幻觉问题。SOPs 总结人工操作流程经验,从而让 agent 的职责和产出结果标准化、agent 间的协作完全符合要求。
3.2 SOP格式定义
04
JarvisBot是一个中枢神经模块,做决策和触发任务,不做具体的业务逻辑。它链接用户(LUI层)和业务层,跟用户进行自然语言的交互,理解自然语言描述的SOP ,指挥底层系统完成对应的任务。它的几个重要部分包括:
不同的 Agent 具有不同的技能,比如DirectorAgent规划智能体工作流、CoderAgent监听PRD生成代码,DiagnosisAgent监听诊断类问题产生诊断结论等。
05
既然SOP是驱动多智能体协作的关键,如何持续产出 SOP 是让多智能体架构真正具有自主进化的能力关键。如何产出 SOP依赖于数据提炼的能力。因此:如何构建数据飞轮并且利用数据飞轮持续优化提炼SOP, 是实现多智能体持续进化的关键。
5.1 大小模型飞速协同进化,是智能性进化的根基
智能体架构底层依靠一系列不同尺寸的模型。其中通用大模型用于通用知识理解和复杂推理,轻量级模型用于SFT 微调。
JarvisBot智能体的核心思路是用大模型教会小模型,借助大模型去构建小模型SFT训练优质数据集,在不同细分场景大量的使用小模型,从而达到智能性和成本的完美平衡。
△不断剪裁模型尺寸
△大模型教会小模型
基于离线AI 对话评估系统利用规则库、参考历史相似语料打分、语料聚类抽样、多LLM(文心4、GPT4、专精SFT模型等)群体智能打分,评估线上对话语料。单日机器可自动完成评估对话条目4w+,产出大量的评估报告推动JarvisBot从产品、LUI技术解析和模型基座多个角度飞速进化。
5.2 如何实现持续进化—数据飞轮训练专家模型,自动提炼SOP
通过自动化评估系统,可以不断评估智能体的智能性,不断洞察用户的需求,包括产品功能使用情况、未满足的功能诉求、用户习惯操作动线等。借助数据飞轮可以不断训练出专家模型,自动提炼SOP,从而帮助多智能体不断的持续进化。
06
END
推荐阅读
轻松搞定平稳运行,数据库平台 DBStack 帮助 DBA 运维不同基础设施上的各类数据库
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-09
AI 编程:Cursor 实现简历筛选 App - 完成大模型简历分析功能
2025-01-08
Agentforce是什么?AI驱动的自动化流程
2025-01-08
震撼揭秘!AI代理:如何在企业中实现70%-90%的自动化革命?
2025-01-07
合规安全的AI助手,助力员工效率翻倍
2025-01-07
Sam Altman:OpenAI确定发布AI Agents,彻底改变企业效率
2025-01-01
普华永道发布2025年AI预测:AI Agents将劳动力提升1倍
2024-12-29
Agentic AI 将深刻影响企业中每一个职能角色人员的工作方式
2024-12-29
“数字劳动力”这门生意的第一性原理
2024-10-24
2024-04-24
2024-07-11
2024-09-27
2024-04-18
2024-04-19
2024-06-26
2024-06-22
2024-04-05
2024-04-11
2025-01-08
2024-12-27
2024-11-28
2024-11-05
2024-10-30
2024-10-04
2024-09-10
2024-09-06