微信扫码
添加专属顾问
我要投稿
推理模型时代,系统提示词依然扮演着不可替代的角色。 核心内容: 1. 系统提示词在AI系统中的角色和定义 2. 推理模型R1对系统提示词的影响分析 3. MoE架构与系统提示词的关系解读及实际应用比较
AI系统提示词(System Prompt)是预先放模型内部的结构化指令集,相当于AI的“人格说明书”和“工作指南”,与用户直接输入的用户提示词(User Prompt)形成互补。一般包含角色定义、任务目标、行为边界、输出格式等规则。比如下列就是一个系统提示词的设计示例:
人设就属于系统提示词中的重要方面,在DeepseekR1推理模型出现之后,部分AI创作者说不需要再写人设提示词了,我觉得他们可能混淆了【用户提示词】和【系统提示词】。
用户提示词方面,他们说是用户可以直接输入所要完成的任务和目标,不再需要写人设,也不需要把工作流程规定得太死,如果写了反而会阻碍推理模型的创造力,理由主要是推理模型用了RL强化学习的方式。
但R1-Zero版本用的是RL强化推理,最终产品面世的R1版本,也是有加入了人类监督微调SFT的,不是纯粹的推理模型,而且现在GPT4O、Claude3.5,其实也兼具推理能力,只不过没有外露而已。
所以对于推理模型要不要写人设这一点,我还没有肯定的答案。因为我对写和不写产生的结果差异,很难分辨出来。
系统提示词方面,目前我用扣子AI应用开发平台在做佛陀功能的智能体时,仍然沿用之前的结构化提示词的写法,R1的回复效果也非常好,暂未找到更适合R1推理模型的系统提示词写法。以下是相同输入【人生没有钱怎么办】,V3和R1的回答,实质上差不多。
我之前有一种误区,以为采用了MoE架构的模型,会对系统提示词的人设有更好的遵循,我以为是有直接的因果关系,后来去查了资料发现是我想当然了。
Moe是在模型的底层计算和架构层面运作的。它关心的是模型如何在内部处理信息,如何分工协作更高效。而系统提示词是在模型的高层行为指导和交互层面运作的,关注的是输出的“内容和风格,以及如何与用户互动。
一个模型采用MoE架构,并不代表它能否很好地遵循系统提示词设定的人设。同样,一个非MoE的密集型模型,也可能很好地遵循人设。架构选择和遵循指令的能力是两码事。
总结:
MoE是一种着眼于计算效率和模型规模扩展的架构选择。系统提示词中的人设是一种用于指导模型行为和输出风格的高级指令。它们处于不同层面,基本上是相互独立的。MoE架构带来的模型整体能力的提升,可以间接地让模型有更好的基础,去理解和执行系统提示词中设定的人设要求。
改变其中一个维度(比如从其他架构换到 MoE 架构)并不直接规定另一个维度(人设)必须是什么样子。反之,改变人设(从助手变为伙伴)也不需要改变底层的 MoE 架构本身。
不写系统提示词的影响:
不写系统提示词的话,你需要在每次的用户提示中都重复一些指令或约束,增加了沟通成本和出错概率。
当然,写出合适的系统提示词依赖于技巧和经验,需要多次尝试和优化。虽然过于冗长或严格的系统提示词,有时反而会限制模型的创造力,或理解复杂指令的能力。
但何为【过于冗长和严格】,目前并没有一个明确的判断标准,仍需探索。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-02
浅谈如何利用【提示工程】赋能你的业务场景
2025-04-01
「AutoGLM沉思」提示词示例(10+场景)
2025-03-31
让 LLM 来评判 | 设计你自己的评估 prompt
2025-03-31
自动化优化 Prompt:MARS 框架引入苏格拉底式引导
2025-03-26
Chain-of-Draft(草稿链)是提示技术的新王者
2025-03-24
游戏设计提示词 - 集换式卡牌游戏(TCG)框架设计
2025-03-23
游戏设计提示词 - 冒险游戏框架设计
2025-03-23
Cursor Agent模式的系统提示词被挖,GitHub 6.1k Star!
2024-08-20
2024-06-29
2023-06-08
2024-09-17
2024-06-27
2024-06-26
2024-07-09
2024-07-12
2024-09-16
2024-06-14
2025-02-25
2025-02-21
2025-01-05
2025-01-04
2024-12-15
2024-11-15
2024-11-01
2024-10-29