我要投稿

【AI助手】用长期记忆去掉AI爱总结的毛病

发布日期：2024-06-14 05:02:21 浏览次数： 1658

在打造一系列知识助手的过程中，笔者反复在思考一个问题，大模型不能完全遵循人类的想法，到底有什么办法可以解决？当然，这里指的是合规合法的内容。比如我想让它列出故事的内容，它不能精准地做到，这就造成一种苦恼和矛盾，实际上它有能力做到，但是它不做，或者说控制不止自己。再比如，它列出故事之后都会习惯性地加上自己的讲解或总结，这个也是笔者不想要的，实际场景也很好理解，比如看完一部电影，就不想要听别人的评论，希望可以自己消化总结，当然听别人的看法是有好处的，但不是这种硬塞过来的评论。从大模型的设计机制上来考虑，就会想是不是它就是被设计成这样子，它的底层结构和算法就会导致这种结果，是白璧之瑕吗？经过笔者的测试，大模型确实很顽固，但是，智能体却是可朔之才。怎么说，给大模型加上人设，然后开启它的长期记忆，我们就能把智能体训练得越来越聪明。

新建一个智能体，然后开启它的长期记忆：

接着给它设定人设：

就像人工智能专家给AI设定基本准则一个道理，我们也用一样的格式给它设定一些规则。这个规则设定是一个不断优化的过程，不同的大模型有不同的“脾性”，可以根据它的具体表现，增添不同的规则。

起初，大模型还是不能很好地遵守规则：

需要提醒它，它才能意识到错误：

经过多次提醒，它就能从长期记忆中学到东西了：

解决完大模型这个毛病后，进而延伸出来的问题就是，我们应该依赖这种提示词优化，还是等大模型的训练。大模型有针对性地训练肯定是更有效果的，就像奥特曼说过的，新模型（意指GPT-4o或GPT-5）会让许多创业公司的努力变得白费。但是，我们也不能小视用提示词进行微调的作用，事实证明智能体微调是有潜力的。同时，一旦我们察觉某个方面的优化是有价值的，我们也可以尝试让更多人意识到这方面的价值，反向推动大模型自身的优化。

OK，就到这。

53AI，企业落地应用大模型首选服务商

产品：大模型应用平台+智能体定制开发+落地咨询服务

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

全面对比dify、coze、streamlit、chainlit

2024-04-26

“大数据+”医疗

2024-04-11

太强了！10大开源大模型！

2024-05-06

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

2024-06-12

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

大模型训练及推理【硬件选型指南】及 GPU 通识

2024-05-09

HealthGPT：华工数字孪生人实验室发布主动健康大模型基座

2023-07-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

大家都在问

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验

2024-09-20

史上最强编程助手来了！GitHub Copilot再进化，引人OpenAI o1！

2024-09-20

OpenAI携手T-Mobile，AI客户体验新时代到来了

2024-09-20

37手游在 AI 智能分析的探索

2024-09-20

用 Cursor AI 30分钟内打造汉字临摹模板生成器

2024-09-20

一文带您解锁鸿翼OpenContent 智能文档云V8的六大AI应用场景

2024-09-20

智能对决：提示词攻防中的AI安全博弈

2024-09-20

斯坦福重磅，突破小规模语料瓶颈，EntiGraph合成数据增强算法让LLM更聪明

2024-09-20

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

万字长文解析：大模型需要怎样的硬件算力

全面对比dify、coze、streamlit、chainlit

“大数据+”医疗

太强了！10大开源大模型！

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

大模型训练及推理【硬件选型指南】及 GPU 通识

HealthGPT：华工数字孪生人实验室发布主动健康大模型基座

Ollama 本地运行大模型(LLM)完全指南

大家都在问

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验

史上最强编程助手来了！GitHub Copilot再进化，引人OpenAI o1！

OpenAI携手T-Mobile，AI客户体验新时代到来了

37手游在 AI 智能分析的探索

用 Cursor AI 30分钟内打造汉字临摹模板生成器

一文带您解锁鸿翼OpenContent 智能文档云V8的六大AI应用场景

智能对决：提示词攻防中的AI安全博弈

斯坦福重磅，突破小规模语料瓶颈，EntiGraph合成数据增强算法让LLM更聪明

热门标签

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

万字长文解析：大模型需要怎样的硬件算力

全面对比dify、coze、streamlit、chainlit

“大数据+”医疗

太强了！10​大开源大模型！

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

大模型训练及推理【硬件选型指南】及 GPU 通识

HealthGPT：华工数字孪生人实验室发布主动健康大模型基座

Ollama 本地运行大模型(LLM)完全指南

大家都在问

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验

史上最强编程助手来了！GitHub Copilot再进化，引人OpenAI o1！

OpenAI携手T-Mobile，AI客户体验新时代到来了

37手游在 AI 智能分析的探索

用 Cursor AI 30分钟内打造汉字临摹模板生成器

一文带您解锁鸿翼OpenContent 智能文档云V8的六大AI应用场景

智能对决：提示词攻防中的AI安全博弈

斯坦福重磅，突破小规模语料瓶颈，EntiGraph合成数据增强算法让LLM更聪明

热门标签

太强了！10大开源大模型！