微信扫码
与创始人交个朋友
我要投稿
RAG(检索增强生成)是一种结合了外部信息检索与大型语言模型生成能力的技术,用于处理复杂的信息查询和生成任务。在大模型时代,RAG 通过加入外部数据(如本地知识库、实时数据等)来增强 AI 模型的检索和生成能力,提高信息查询和生成质量。比如:文心一言的插件服务,支持把实时又或者私有化知识提供给LLM。
首先会思考怎样完成这个任务。
然后会把任务拆解成多个子任务分步进行。
接着评估现有工具能够帮助我们高效达成目的。
在执行任务的时候,我们会对执行过程进行反思和完善,以持续调整策略。
执行过程中思考任务何时可以终止。
2、记忆(Memory)
短期记忆,如:单次会话的上下文记忆会被短暂的储存,以用于多轮会话,在任务完结后被清空。
通过调用软件系统不同应用模块的API,获取到指定的业务信息,以及执行业务的操作权限。
通过调用外部的插件工具,来获取原本LLM并不具备的能力,如:文心的Chat files插件获取文档解析能力;扣子的ByteArtist插件获取文生图能力等。
推理1:当前知识不足以回答这个问题,需要知道当前所在方位以及附近的餐厅
行动1:使用地图工具(Tools)获取当前所在方位
结果1:得出附近餐厅列表
推理2:确定预订的餐厅,需要知道您的饮食偏好以及其余细节(如:吃饭时间、人数)
行动2:从记忆(Memory)中获取您的饮食偏好、人数、时间等信息
结果2:确定最匹配的餐厅
推理3:基于结果2,评估当前所拥有的工具能否完成餐厅预订
行动3:使用相关插件工具,进行餐厅预订(Aciton)
结果3:任务完成
第一步:通过各种方式整理汇报周期内,联系了哪些客户;商机都推进到什么阶段;哪些客户完成转化成交,成交业绩多少等行为信息
第二步:把零散的行为信息,重新梳理,转化为汇报格式(如:内容+当前进度+预期等格式)
第三步:选择汇报人,提交报告
这个过程中,员工把大部分的时间都耗在了收集与整理行为信息的工作上。
到了Agent的阶段,我们不妨以智能体的基础框架出发,构建【工作报告智能体】的框架。
规划(Planning),编写Prompt的时候,让LLM对“生成工作报告”任务进行拆解,分为了获取基础数据—整理输出报告—选择汇报人—执行提交四步。
工具(Tools),受限于LLM无法获取私有化知识的问题,通过RAG技术,接入数据中心API来获取客户联系、流转、成交等明细数据;以及接入工作报告应用API来获取“填写”与“提交”的业务执行权限。
记忆(Memory),把员工以往的汇报内容进行分析,提炼出汇报文案风格、内容格式、汇报周期、汇报人等特征信息,作为长记忆进行存储,供撰写报告时使用。
▲工作报告智能体demo
六、总结
▲人类与AI协同的三种模式
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-07-18
2024-05-05
2024-09-04
2024-06-20
2024-05-19
2024-07-09
2024-07-09
2024-07-07
2024-06-13
2024-07-07