微信扫码
和创始人交个朋友
我要投稿
RAG(检索增强生成)是一种结合了外部信息检索与大型语言模型生成能力的技术,用于处理复杂的信息查询和生成任务。在大模型时代,RAG 通过加入外部数据(如本地知识库、实时数据等)来增强 AI 模型的检索和生成能力,提高信息查询和生成质量。比如:文心一言的插件服务,支持把实时又或者私有化知识提供给LLM。
首先会思考怎样完成这个任务。
然后会把任务拆解成多个子任务分步进行。
接着评估现有工具能够帮助我们高效达成目的。
在执行任务的时候,我们会对执行过程进行反思和完善,以持续调整策略。
执行过程中思考任务何时可以终止。
2、记忆(Memory)
短期记忆,如:单次会话的上下文记忆会被短暂的储存,以用于多轮会话,在任务完结后被清空。
通过调用软件系统不同应用模块的API,获取到指定的业务信息,以及执行业务的操作权限。
通过调用外部的插件工具,来获取原本LLM并不具备的能力,如:文心的Chat files插件获取文档解析能力;扣子的ByteArtist插件获取文生图能力等。
推理1:当前知识不足以回答这个问题,需要知道当前所在方位以及附近的餐厅
行动1:使用地图工具(Tools)获取当前所在方位
结果1:得出附近餐厅列表
推理2:确定预订的餐厅,需要知道您的饮食偏好以及其余细节(如:吃饭时间、人数)
行动2:从记忆(Memory)中获取您的饮食偏好、人数、时间等信息
结果2:确定最匹配的餐厅
推理3:基于结果2,评估当前所拥有的工具能否完成餐厅预订
行动3:使用相关插件工具,进行餐厅预订(Aciton)
结果3:任务完成
第一步:通过各种方式整理汇报周期内,联系了哪些客户;商机都推进到什么阶段;哪些客户完成转化成交,成交业绩多少等行为信息
第二步:把零散的行为信息,重新梳理,转化为汇报格式(如:内容+当前进度+预期等格式)
第三步:选择汇报人,提交报告
这个过程中,员工把大部分的时间都耗在了收集与整理行为信息的工作上。
到了Agent的阶段,我们不妨以智能体的基础框架出发,构建【工作报告智能体】的框架。
规划(Planning),编写Prompt的时候,让LLM对“生成工作报告”任务进行拆解,分为了获取基础数据—整理输出报告—选择汇报人—执行提交四步。
工具(Tools),受限于LLM无法获取私有化知识的问题,通过RAG技术,接入数据中心API来获取客户联系、流转、成交等明细数据;以及接入工作报告应用API来获取“填写”与“提交”的业务执行权限。
记忆(Memory),把员工以往的汇报内容进行分析,提炼出汇报文案风格、内容格式、汇报周期、汇报人等特征信息,作为长记忆进行存储,供撰写报告时使用。
▲工作报告智能体demo
六、总结
▲人类与AI协同的三种模式
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-22
TrustRAG:为AI知识检索打造更安全的防线
2025-02-22
DeepSeek+RAGFlow 本地部署避坑指南,一文搞定常见难题!
2025-02-22
基于DeepSeek的本地化知识库 RAGFlow 搭建(附带镜像链接)
2025-02-22
RAGFlow+DeepSeek-R1:14b落地案例分享(足够详细):机加工行业设备维保场景
2025-02-21
DeepRAG:LLM时代的智能检索革命(实测提升准确率21.99%)
2025-02-21
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
2025-02-20
本地运行DeepSeek R1 + RAG系统
2025-02-20
传统分块已死?Agentic Chunking拯救语义断裂,实测RAG准确率飙升40%,LLM开发者必看!
2024-09-04
2024-10-27
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-02-15
2025-02-12
2025-02-05
2025-02-05
2025-01-24
2025-01-24
2025-01-20
2025-01-18