我要投稿

Agent memory大揭秘：5种记忆形态，轻松拿捏！

发布日期：2024-08-12 13:36:40 浏览次数： 2309 作者：探索AGI

今天我们来聊聊LLM Agent背后的记忆机制，特别是记忆的形式。你可能听说过，LLM就像一个厉害的不得了的聊天助手，它可以记住之前的对话内容，还能学习新知识。但你知道它是怎么做到的吗？这就要说到记忆的形式了。

记忆可以是文本形式的，就像我们平时说话那样，直接明了。这种方式的好处是易于理解和实现，而且读写速度都很快。但是，如果记忆太长，就会占用很多空间，影响处理速度。想象一下，如果你要记住一整本书的内容，那得多费劲啊！

文本形式的记忆可以进一步细分为几种类型：

存储完整的交互信息
最近的交互信息
检索到的交互信息和外部知识。

至于用哪种类型，各有利弊，比如存储完整的交互信息可以保留所有细节，但可能会因为信息量太大而影响效率；而只存储最近的交互信息则可以快速访问，但可能会遗漏一些重要的历史信息。

下图为MemGPT研究中的示意图，分别体现出了短期和召回记忆；至于完整的交互记忆，大家经常使用的ReAct就是，在Qwen-Agent中，通过chatml特有的多轮的格式<im_start> <im_end>进行分割历史的会话，最后一轮才加上ReAct的prompt。

另一种形式是参数形式，这种方式更高级一些。它不是直接存储文字，而是把记忆转换成模型参数，就像是把知识压缩成精华。这样做的好处是不会受到文本长度的限制，而且存储效率更高。但是，这种形式的记忆在写入时可能需要更多的计算，而且解释起来也不如文本形式直观。

参数形式的记忆则涉及到一些更复杂的技术，比如fine-tuning和editing。微调可以帮助模型快速学习特定领域的知识，而知识编辑则可以精确地更新或删除某些记忆，避免影响其他无关的知识。

经典的Character-LLM: A Trainable Agent for Role-Playing，就是使用的微调的方式，如下图：

文本形式的记忆和参数形式的记忆同样也是各有千秋，它们适合不同的应用场景。比如，如果你需要快速回忆最近的对话，文本形式可能更合适；而如果你需要存储大量的知识，或者需要一个稳定可靠的知识库，参数形式可能更有优势。

同样这里提供一份经典的Agent系统，他们关于记忆的形式的汇总表格如下：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-20

我对扣子空间与Manus的产品的思考

2025-04-20

MCP很好，但安全问题不容忽视，智能体安全框架可以解决

2025-04-20

赛博中医大师已经开始为你把脉了

2025-04-20

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

AIGC应用必坑指南与落地实战方法论

2025-04-20

「合成用户」进化：基于访谈生成的 1000 个虚拟用户，能产出洞察吗

2025-04-20

扣子空间火了，是国产通用 agent 一个好的开始，比 manus 还差不少

2025-04-20

微软偷偷上线一款MCP神器，可让Office文件秒变Markdown！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

2025-04-13

有了MCP，还需要深入研究Agent吗？

2025-04-13

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB