我要投稿

Agent的进化：RAISE如何让AI更聪明？

发布日期：2024-09-03 05:27:27 浏览次数： 1929 来源：探索AGI

今天和大家聊聊一个经典的，贝壳提出的RAISE Agent架构。除了架构之外，还包含一个全面的智能体训练框架，从数据选取到场景增强等等。

From LLM to Conversational Agent: A Memory Enhanced Architecture with Fine-Tuning of Large Language Models

本文介绍了 RAISE（通过 Scratchpad 和示例进行reasoning和acting），这是一种高级架构，可增强 GPT-4 等大型语言模型 ( LLMs ) 与会话Agent的集成。 RAISE 是 ReAct 框架的增强版，包含双组件记忆系统，反映人类短期和长期记忆，以保持对话的上下文和连续性。它需要一个全面的agent构建场景，包括对话选择、场景提取、CoT 完成和场景增强等阶段，最后进入LLMs培训阶段。这种方法似乎增强了agent在复杂的多轮对话中的可控性和适应性。我们在房地产销售环境中的初步评估表明，RAISE 比传统Agent框架具有一些优势，表明其具有更广泛应用的潜力。这项工作为开发更多上下文感知和多功能对话Agent提供了一个强大的框架，为人工智能领域做出了贡献。

RAISE的核心是它的双组件记忆系统，这就像是我们的短期和长期记忆。短期记忆部分，也就是草稿，会记录下最近的互动信息和结论，而长期记忆部分则负责提取与当前对话相关的信息。

这个架构的厉害之处在于，它能让AI在多轮对话中保持连贯性和上下文意识。这就像是，你和AI聊着聊着，它突然能接上你之前提到的一个话题，这种感觉就像是和真人聊天一样自然。

5种Agent框架差异

附带的还包括一个相对全面的智能Agent构建的模型训练方法，包括对话选择、场景提取、思维链完成和场景增强等阶段，最终达到训练大型语言模型的目的。这种方法不仅能提高Agent的控制性和适应性，还能让AI在复杂对话中表现得更好。

实验结果表明，RAISE在房地产销售领域的对话中，比传统的聊天代理有更好的表现。这不仅仅是在房地产领域，RAISE的这些原理和方法论也可以应用到其他领域，显示出它的多功能性。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-03-10

基于 Apple Silicon 架构的Mac部署DeepSeek-R1-671B 模型本地化指南

2025-03-10

RoostGPT：改变了自动化软件测试的游戏规则

2025-03-09

8分钟打造一个DeepSeek API智能测试引擎：当咖啡还没凉，测试报告已出炉

2025-03-09

lceberg 助力 B 站商业化模型样本行级更新的实践

2025-03-09

单卡4090微调DeepSeek-R1-32B

2025-03-08

QwQ总结能力测评，32b小模型真能超过deepseek吗

2025-03-08

为什么vLLM做不到？解密Ollama越级部署黑科技：以DeepSeek-R1-8B为例

2025-03-07

为什么Manus底层模型没用DeepSeek？——Manus六问六答

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

FP8 低精度训练：Transformer Engine 简析

2024-07-11

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

大家都在问

Manus，为何是他们做出来了？

2025-03-07

在树莓派5上运行9款流行的AI模型：哪些能用？哪些不行？

2025-03-05

DeepSeek到底用了多少GPU？

2025-03-05

Ollama和vLLM我们到底应该用哪个？

2025-03-04

模型部署：Ollama 和 GPUStack如何选择？

2025-03-04

为啥大模型要设计成预训练和微调两个阶段？

2025-02-28

LLM 联网搜索，到底是咋回事？

2025-02-25

如何在通义灵码里用上 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型？

2025-02-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204 陈先生 185 8882 0121

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部