AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


见知录 Vol.001:最小化提示词原则
发布日期:2024-12-18 09:18:06 浏览次数: 1634 来源:一泽Eze


 


先推荐今年最感动的一首歌。LiSA 的《Hello world》,温柔且富有生命力,作为开篇再合适不过。 

今年有幸在 LiSA 亚巡 2024 上海站的现场,和全场观众一期合唱了这首歌,那种感动至今难忘。 


写在 Vol.001 的开头:聊聊我和专栏定位

见知录是写给自己的阶段性反思,将记录我对“我想成为什么样的人”的探索,以及途中的所见所思。 

如果你是第一次看到我,你也可以通过我的个人主页 ? link.eze.is ,深入了解我做过的、正在做的事。 

从当下的优先级来看,我希望我能成为: 

  • AI 时代下,有“人情”味的创造者:多多关注“人”的需求,创造有人爱用的新应用。具体形式上,无论是 Prompt,还是更完善的产品形态,皆是如此。
  • 不断学习、心存好奇的“真”人:世界很大,在不断变化,走在路上总会遇到新人、新事。持续学习并搞懂自己感兴趣的课题,既是与“退化为地球 Online 的 NPC”这事划清界限,长期来看也能增加抗风险的能力。
  • 好产品经理:做出好产品一直是我的执念,甚至个性签名都是“做自己认同的内容,改变一小撮人的生活”。真的,做出自己认可的东西,还能产生价值和影响力,实在是太酷了。

为此,这个专栏也将多关注 AI、产品、知识管理、商业、哲学 领域,从我最近在做的事、在看的信息中,筛选值得回顾的部分进行整理,分享我的反思和收获。 

 

好了,就介绍到这里,让我们开始吧。 


实践:「最小化提示词」原则

1)从「输入-输出」视角设计 AI 产品

最近在探索 AI 产品设计的过程中,多次陷入了提示词的 workflow、template 的精雕细琢,最终却发现为了更好的 AI 效果,需要从用户输入与整体逻辑推倒重来的情况。 

 

AI 应用设计,应当花更多的精力去思考 AI 系统“输入-输出”的边界 

“提供哪些 input 为 AI 所用,需要 AI 输出何种回应”,远比为 AI 灌入方法论、干预 AI 的决策过程更重要。 

 

AI 个人事务管理系统中,让 AI 基于用户的身份、年度 OKR、近期目标等信息进行动态优先级评分,远比人为设定的通用优先级打分规则,更能照顾真实的用户的最佳决策需要 

 

其实大模型有着比人类更强的模式识别能力,更加擅长做关联思考、量化分析等系统二的思考。 

当我们提供足够丰富的上下文信息时,它能够自主发现信息之间的关联,形成比人工规则更细腻的决策依据 

 

即使希望提升输出的质量,也应该先尝试优化输入环节的数据种类和质量,而不是补充复杂的方法论提示来约束模型行为。 

 

2)最小化提示词原则

同样的,在 AI DEMO 的提示词调试阶段,我会更主张优先尝试简练的提示词策略:定义清晰的输入和输出目标,看看 AI 的反应,而不是过度框定方法论。 

也就是优先定义“有什么、做什么”,而不是“怎么做”——把我们的提示词设计“最小化” 

 

比如,提示 AI 它有什么信息可用,需要输出什么结果(PS:few-shot 技巧也是非常好的提示技巧) 

复杂规则的提示词更容易生成僵化、千篇一律的结果 

 

主要考虑点有三: 

  • 输出目标的确定性:
    • 在特定场景中,我们对输出的期望通常是稳定的
    • 相比之下,“怎么做”路径可以更加灵活
  • “黑盒”模型能力的最大化:
    • 实践表明,聪明的大模型能在高维嵌入空间自主建立更丰富的信息关联
    • 比如,Claude AI 脱离人类 Prompt 的机械方法论后,反而能创作出更加优秀的文学作品
    • 过度详细的方法论指导反而可能限制模型的发挥
  • 模型迭代的适应性:
    • 各家厂商的模型能力在持续提升,过度复杂的提示词可能面临与微调相似的版本适配问题——当模型基座升级后,之前精心设计的提示词反而限制了新版本模型能力的发挥。

 

待 DEMO 初具雏形后,为生产环境的用户体验,再逐步提升提示词的要求精细度,提升 AI 输出的稳定性。 

 

推荐阅读: 

  • Claude 共振式提示词 by 李继刚|AI 自主创作优秀文学作品实践案例


思考:语言是对世界的理解框架

因为研究提示词设计,自然也会对「语言」的实质有所好奇。 

 

在读了《寻觅意义》的开篇“中西方文化差异的渊源”后,自己的理解也变得更加清晰: 

  • 人类通过语言这套符号系统,为外部事物、知识概念贴标签,从而得以保存、传达信息
  • 语言是对世界的理解框架
    • 例如,提起“世界”一词,我们才能意识到自身存在于一个广阔的世界之中,其中有山川河流,人间百态;
    • 倘若没有“世界”这个语言概念,我们对环境的感知也将局限于狭小的周遭
    • 人类借助语言存储、回忆、传达过往的体验、情感、经验。这类似大模型的 Prompt,可以定向提升特定领域知识的输出概率
    • 正如维特根斯坦的名言:“我的语言的界限意味着我的世界的界限”
    • 如果失去语言,人就无法清晰地回忆起过往体验的细节与思考
  • 同时,人以语言为家,每种语言传承着独特的群体智慧与集体文化
    • 提起汉语的“家”,脑子里回想到的,必然是中国式的家庭关系
    • “缘分”是典型的中国文化特色的概念,很难在其他文化中找到一个能同时象征“宿命论、必然性与偶然性共存”的概念。所以外国人很难理解“有缘千里来相会”的“缘分”,因为他们的文化中缺乏类似的观念和表达方式
    • 比如,汉语保存着中国人的群体文化、体验、情感、知识
  • 所以,不同母语者之间,不仅仅是语言的不同,更有着对世界的理解差异。而一种语言的消失,是对世界理解框架的消失

那么,基于统计关联进行思考的大语言模型 AI,是否能用特殊语种的词汇,创作更好的提示结果呢? 


立刻记下你的灵光和感动

原本这期想分享更多最近的阅读心得,但在整理回顾的时候,却发现难以重现初读时的触动与思考。 

人的每个想法,都不是对单一刺激的简单回应,而是个人知识、近期见闻、瞬时情绪共同触发的概率结果 


正如胡塞尔所描述的“意识流”,我们的意识并非静态的容器,而是各种经验持续流动的过程,想法便在这种流动的交织中涌现。 


所以务必立即记下自己乍现的灵光与感动,一旦错失,便难以重觅。 

 


好用:用 Claude 画各种封面、海报的提示词

自从 Claude 3.5 sonnet 更新到新版后,增强了视觉理解与编程质量,词生卡效果已经完美进化到下一个 Level(当然,有时还是需要“抽卡”) 

用 Claude 画公众号封面

// 作者:一泽Eze
// 名称:公众号封面绘制
// 用途:根据文章内容绘制公众号封面
// 版本:v0.1
// 模型:Claude 3.5 sonnet new

请帮我设计公众号文章的封面,你可以先通读文章,提炼要义,思考适合用来做封面的灵感。

我希望你能巧妙运用 emoji、对话框等元素,运用 react ,制作出具有极佳设计感、文字不错乱、具有高级品牌感的公众号封面

## 以下是正文:
{{直接粘贴你的原文}}

效果示例: 

如果第 1 版效果一般,可以多尝试以下方法: 

  • 通用改进提示词
你是超强的视觉设计师,请反思当前版本的问题,迭代并改进,要有高级感、品牌感
  • 直接提出针对性意见,如:主题色改为浅色调增加文字投影效果

 

用 Claude 画海报

// 作者:一泽Eze
// 名称:海报绘制
// 用途:绘制简单海报
// 版本:v0.1
// 模型:Claude 3.5 sonnet new

用 React 绘制可视化的海报,{{填写目的,如宣传预告}}

{{粘贴可供参考的文案、内容}}

如果需要调整海报内容,可给出具体提示,如 白色底,浅绿色主题,轻微投影 

 

用 Claude 绘制可视化概念图,用于 PPT 等插图场景

// 作者:一泽Eze
// 用途:生成可视化图片,辅助 PPT 等场景插图
// 版本:v1.0
// 模型:Claude 3.5 sonnet new

深入理解下面的内容,step by step 进行核心主旨分析、关键要素提取、逻辑结构分析,用 react 绘制可视化图

## 注意!
1)判断内容丰富度:如果内容要素过于简单,可根据正确的知识适度拓展内容要素
2)体现专业感、高端感
3)如无必要,必须用中文
4)不要点击交互

## 内容
{{需要表达的核心内容}}
  • 浅色版示例:
  • 深色版示例:

 

用 Claude 绘制微信 UI

总之,发挥脑洞,只要是网页、软件界面设计能做出的图片效果,只要没有专业要求,大部分都能靠 Claude AI 来实现了。 

 

如果你很想试试这种 AI 应用方式,我常用以下 2 种途径: 

  1. Monica.im :一个优秀的 AI 助手工具,付费后可使用 Claude 3.5 sonnet 、ChatGPT-4O 等顶级大模型(也是我目前最常用的 AI 对话助手)
  2. Claude.ai :claude 官方原版,注册后可每日限额免费体验(但存在较高的封号风险)

也可以通过 Cursor、Windsurf 等 AI 编程产品,调用 Claude AI API,但不支持 Artifacts 这种即时预览的使用方式,需要单独保存代码文件后查看。 

不过好处是,可以用 MD、CSV 等格式的文件,存储提示词、更新记录和 AI 交互数据。 

 

有趣:Jiffy Reader - 让网页阅读更快

  • 一个有意思的 Chrome 插件,动态修改网页文本样式,加粗每个单词的前半部分,引导眼睛快速浏览内容。
  • 参考了仿生学设计,符合人类视觉认知特点:
    • 我们的眼球运动并非连续的,而是通过"跳跃式扫视"来阅读;
    • 大脑实际上并不需要看到每个单词的完整形态;
    • 减少认知负担:突出关键部分,降低了大脑处理每个单词所需的努力;
    • 引导注意力:字体的变化创造了视觉节奏,帮助维持阅读专注度。
  • ADHD 人群反馈效果显著。

Btw:AI 编程降低了独立开发门槛后,可以多试试解决这种有意思的小众需求 


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询