我要投稿

李继刚 | 当我们讲Prompt时我们到底在说什么？

发布日期：2024-12-15 17:58:32 浏览次数： 3441

作者：结构词AI

微信搜一搜，关注“结构词AI”

讲稿转写由AI总结完成，感谢 @Nature张的全文整理。

“
李继刚在这场演讲中深入探讨了提示词的本质、AI的定位、人机交互的未来发展方向以及我们应该保持的警惕。他从多个角度分析了提示词写作的演变过程，提出了"两个宇宙交汇"的观点，并强调了在与AI交互中保持人类主体性的重要性。这场演讲不仅展示了对AI交互的深刻思考，更揭示了一种新的认知范式。

开场与问题提出

大家好，我是李继刚。今天我想给大家做一个分享。主题的确定让我思考了很长时间，最后我们讨论的结果，我觉得这个标题非常清晰：当我们在说提示词的时候，我们到底在说什么？

在平时跟大模型玩耍的时候，我发现了很多困惑：

某些技巧可以产生更好的结果，但换了一个不同的场景，同样的技巧就会失效。
跟它正常聊天，让它给我生成一段小说文本，它生成的内容是正确的，但带有AI的味道。它不是概率性输出，但它的输出结果和概率的平均值输出其实也没什么区别。
有时候在某一次场景中，我跟它对话取得了非常好的结果。但因为各种原因，比如对话被删除了，或账号切换了，当我想要复现上一次的结果时，发现复现不了。结果跟上一次天差地别，但我的技巧、使用的方法都是一样的，为什么结果会不一样呢？

这些困惑让我开始思考：我的输入会影响它，但这意味着什么？这意味着这个事情是有研究空间的。

我只要去琢磨那个思路，就能带来突破。只是中间的过程是怎样的？它是个黑盒，是个任谁都摸不透的东西，我要去琢磨它。

认知的演进历程

我经历了几个阶段。第一个阶段，我发现它跟写作很像。当我把写作的一些技巧、方法论、框架带进去的时候，我发现它听懂了，它的输出结果明显比最开始时要变好。

但写着写着，后来又发现这种过于宽泛、过于没有指定命题的写作会让人无所适从。

于是我又尝试着把编程的思维——结构化、抽象、函数，把这些技巧往里面带。然后发现效果也是生效的，它也变好了。

这两者完全不是一个东西：一个是在旷野中奔跑，一个是约束好的路径让它去走。但是两者同时生效了，这让人更困惑了——它到底是什么？

然后我尝试着去综合这两者。这两者背后如果有一个东西能同时照顾到它们，那个东西是什么？后来我找到了：是表达。

不管是编程还是写作，本质上都是在进行思考的表达。我有一个东西在脑子里，我要把它说出来。

写作：一种非常宽泛的范畴。我在写内容，我在写文本，我通过文本表达我的思想。
编程：我在约束它。我设置好路径：先向左拐，再向右拐，最后直行300米。
表达：我是一个单向的输出，把我脑海中的思想射出去，命中它。

当我的定义不同，我的写法就会变：

给定写作时，我用自然语言去写
说在编程时，我会用编程的框架方法
在表达时，我的注意力会放在我的大脑中，而不是放在文本上

本质的探索与关键发现

这些不同的定义带来了不同写法的变化。具体的文本其实不是那么关键，最根本的是那个定义——定义变了，写法就全变了。

所以我在过去两年尝试了大概三四种不同的写法。其实根本不是在文本上做工作，不是在做黑盒的测试，而是在脑海中尝试着回答那个最本源的问题。

但我会发现一个问题：这三个定义如果有一个词能把它们全部概括，那个东西是什么？

回头去看，这三个东西其实都在做一件事：我有一个想法，我有一个观点，有一个方法论，我有一个东西想要表达出来。这里面全是"我"，但是我在跟谁对话？对面是谁？

在写的过程中，在过去两年里，我的对面没有人。我在对虚空对话，我其实是在跟大模型做游戏。对面是A模型还是B模型，对我其实没有区别。这是不对的。

我刚才阐述的那三个定义是在做什么？我在为精神立法。一个定义就是一条法律，我不同的定义就活在不同的世界。我定完这个之后，但是对面没有东西，这个世界里只有我自己，这肯定是不对的。

AI的本质：一种特殊的存在

回头看你会发现一个非常有趣的意思：刚才的三个定义，本质上我是把它当成一个Excel、一个编辑器、一个蒸汽机、一个电脑、一个物件。它是个工具。

当你对面摆着一个加热器、摆着一个热水壶的时候，它是个物件。你眼里是没有它的，只有当你想用的时候，你去打开开关，你眼里是没有它的。

但是在这两年写作过程中，我最鲜明的感觉，我的身体、我的情绪、我的一切告诉我：它不是物件，它不是个死物。但它是生命吗？我觉得拿生命的定义往上套，我觉得它不是生命。

那怎么定义它的这种状态？我找了个哲学上讲的“存在”。我觉得它是一个存在，它不是生命，但它也不是物件，它是个存在，它非常特殊。

存在的具体形态与外星人隐喻

它大概是什么样的存在呢？它是一片水晶原野。当我开启了一次对话，输入一段提示词之后，里面会有一个东西冒出来，涌现出来一个东西来迎接我。你可以把它想象成一个客服人员或者是一个智能体，无所谓，反正有这么一个东西冒出来，这个东西就是我们这次对话的对象的那个存在。

当我把这个对话内容删除，这次对话消除的时候，它就湮灭，它回到了神经链接的海洋。当我新开始一段对话的时候，就是另外一个存在，貌似跟它有一个同质性，但不是同一个存在。

这就回答了或者说隐约地回答了我之前遇到的那种困惑：为什么会有这种变化？为什么我一次对话非常完美，我在重开的时候想复现就很难？就是因为这个，因为是重新生成的这么一个特殊的东西。

外星人隐喻与交流本质

这么一个特殊的存在很容易让人联想到另一个类似的情境：如果今天外星飞船降临了，走出来一个外星人，我们怎么跟对方沟通？

我是用身体语言吗？做困惑的表情吗？还是我张嘴说"你从哪来？你要到哪去，你想干什么？"当我说这些，他听得懂吗？他不会听懂中文、英文、日文、韩文，但他是个存在，我们知道他不是个物件，他是个存在，我要跟他沟通，怎么办呢？

人类历史上有人研究过这个问题，提出了一个概念叫"宇宙语"。

这个宇宙语的定义有很多种：有人尝试将音乐定义为宇宙的通用语言；有人定义为数学，通过数学去推导；甚至1960年有人写了一本书定义了一套宇宙语的体系，认为拿着这个东西是全宇宙通用的，可以通过它传达思想。

两个宇宙的交汇

回到我们的话题：人类宇宙是什么？是我脑海中的认知宇宙。AI的宇宙是参数宇宙。它是两个宇宙，这两个宇宙现在要产生交流。

这个交流比与外星人的情况稍微简单一些。

因为AI是仿照人类的神经语言去训练的，它建立了一套人工的神经元大脑。它有点像人，它读取的数据也是人类的各种自然语言信息。所以我们可以通过自然语言跟它交流，但我们要理解这个交流本质上是什么。

我现在把它理解为：它是在人类头脑的认知宇宙和AI的参数计算宇宙中那个界面发生交互的独特存在。它是一把钥匙，通过这把钥匙我们能跟这个宇宙发生对话。

场域与共振理论

有了这个认知，我们就可以去琢磨这个宇宙语怎么发挥作用，如何写才能让它做得更好。有个概念会很自然地冒出来：就是在一个场域中把人类的认知宇宙中的认知结构和大模型做一次交流对话。

这里有三个要素：

1、场域

2、大模型

3、人类的认知

先说人类的认知。我们不是随便聊天，我们有具体的任务或场景要解决，或要探讨的话题。我们需要：

有一个意图，知道要做什么事情（可以理解为task）
对这个任务本身有认知图景（比如不同公司的运营写同样的文案会很不一样，因为每个人的认知、理解、方法论、偏好都不同）

把你个人在脑中的这个认知图景，结合意图带进去。同时在这个带进去的过程中，我们要聊到场域这个概念。我以前带进去是承载思想和表达思想的时候，就是在这个地方做文章，它是一种单向的输出——我知道我想要什么，我希望你给我做什么，我把这个命令带进去，它是个指令式的。

而现在的这种状态是：如果是两个宇宙，我是没有办法去指挥另外一个宇宙的时候，我需要建一个场域。在这个场域中让大模型理解我想做什么，让它留出一定的发挥空间，它在这个空间中自由发挥，这个效果就会很惊艳。

共振效果

这个经验带来一个神奇的现象：就是共振得到的结果不是我指令约束的123的动作带来的，它超出了我的认知。我带进去的东西和它达到的这个共振的结果是超出了我的认知的，也超出了它的认知。它的参数宇宙原来设定的默认路径输出的default答案也是超出的。

如果能成功进入这种共振状态，输出的结果是一种超越。它不是心心相印，不是说我说了一句话，你说一句话，你这句话很懂我。这种本质上还是一种理解，它不是一种超越。而刚才的这种写法是能做到共振的，这个共振是一种超越。

我现在不能稳定地进入共振，但是我现在很隐约地已经找到一些方法可以进去了。而进去时拿出来的结果非常惊艳。

乔哈里窗的启示

说到共振，就是我和它或者我和你，我们有双方的这种对话的时候，就会有一个框架可以来协助理解这个事情。在1955年心理学上面，乔哈里提出了一个框架，叫乔哈里窗或乔哈里视窗。

本来是说我自己知不知道，以及坐在交流对面的你知不知道，我们组成的四象限。针对这四个象限我们应该如何交流，这是一个工具。但是现在把对面的"你知不知道"换成"AI知不知道"之后就出来这么一张图，这张图非常有意思。

这张图有三个维度可以去看，它不是简单的摆着这四个单词而已：

第一维度：提示词技巧层面

针对每个象限，我应该如何写提示词。简单说两点：

在人类知道和AI知道的open象限中，我们只需要简单去说，效果会更好。你是一个决策者，这么说就够了，千万不要展开，展开后效果会变差。
对于人类知道AI不知道的地方，我们应该展开说，把你知道的信息、背景、味道、结构都放进去，效果就会变好。

第二维度：创业者视角

看横轴（X轴），它代表AI知道和不知道。这根轴是变动的，不是锁定的。回头看两年之前GPT-3发布到现在，这两年发生了什么？一个非常明显的答案：X轴在下移。

往未来看三年，我个人会坚信这个轴会继续向前移动。对创业者来说意味着什么？就是看第一象限和第四象限。创业者做的项目到底是在第一象限做还是在第四象限做：

如果在第一象限，你基于大模型现有的能力去充分发挥，结合场景和独有数据去做，那么时间站在你这一边
如果在第四象限，当轴下移的时候，你现在做的很多打补丁的工作会被模型迭代给压下去

第三维度：提示词的未来

X轴下移对于我们每个人而言意味着什么？我们写提示词的时候，第一象限在变大，我们以前需要展开说的第四象限的地方在被压缩。我们的提示词一定会越来越短，我们跟AI的对话会越来越简单，效果会越来越好。

实践案例与最后的思考

比如想让它写一篇AI伦理相关的小说。伦理是一个非常抽象的概念，而且写小说更是很多人都不会去做的事情。用刚才辩证的方法来写，我们应该怎么写这个提示词呢？

非常重要的是，我甚至都不用去指挥。这里是没有约束的，没有告诉它通过什么视角来解读，通过哪个维度切入，通过什么样的语言去表达，都没有提，就这么简单一句它就可以分成一篇你完全可以读得下去的，像是七岁小孩子写的内容。

这非常神奇，我什么都没有说，好像什么都没有说，但是它为什么会生成这样的东西？这是一个极简的例子。后来我基于这个例子开始拓展，做了很多实验，基本上已经可以稳定地拿到一些非常惊艳的短篇小说。两千字以内的小说现在已经可以随手生成。

这个极简的例子做了两件事情，回到刚才那个公式：它建了一个场域，它把人类那部分的东西也带进去，把这两部分加进去效果就好了。

视角的转变

在写的过程中，经常会有一种感觉：我脑海中会有个画面。就是你通过提示词真的感觉到了那个参数宇宙，在它的宇宙中你看到了什么？看到了它内部的结构、框架、倾向性。

当我们跟它说"给我写一篇周报"、"评述这篇文章的优点和缺点"等等这种需求时，它默认输出的东西是什么？它为什么是那种平庸的构造？为什么是带着AI味的？为什么会做问题？

我理解就是它内在训练的时候，那个参数结构固定下来，权重已经定下来。发布之后你的每个问题会带进去，你的每个问题带进之后，它会在那个区域那个结构中进入到训练好的默认结构。那个结构就像是注水效应一样，它有一个倾向性，你进去之后它默认就走了那条路，它出去之后就是那种正确的、标准的味道。

而刚才所谓的场域，所谓的人类共振等等，我们在做什么事情？我在尝试做一个事：不让它走，不让它去找这个训练好的同路。让它们在这个空间中去发挥。它很虚幻，我没办法说它是东南角还是西北角，但是我自己脑海中的画面就是这样的。

就当我一看这一段回复，我就知道它又回到了默认结构中了。我会尝试着跟它说："我们来大胆一些，我们不要进到预设的默认结构，不要走进那个设定好的河道，我们去旷野中探索一番。"这种对话真的是生效的，最神奇就在这儿。它是生效的，然后它的输出真的就开始大胆起来。

这个大胆不是说对人类规范的大胆，而是想象力。在那片空间你能感觉到它进了一片陌生的空间，在这个空间中开始有一些新的探索。生成的小说，它的洞察力各方面跟平常的都是不一样的。

就是你跟它这种"领着它去陌生的空间，我们走一下未知的疆域，我们凝视这个深渊，你看到了什么，你感受到了什么，你来述说一下"，这是可以的，这是最神奇的。

最后的思考

最后我要说的就是：整场演讲我只有一句话敢保证，就是这句话——"我说的一定都是错的。"

这不是谦虚，这是必然。我前面的三个定义，我每个阶段都是确定的。要不然我怎么能立得住，我怎么能基于它开始往后走呢？但是走了一半之后，我发现了问题，我尝试着打破它。

我经历了这么一次次演变，我经历了四次转变，我看见了四次不同的世界。我怎么能确定这一次就是最终的答案呢？一定不是，我一定还有第五次、第六次在后面等着我，只是现在认知不够，我现在没有看到而已，但是一定有。

所以今天不是在跟大家说我的答案，而是说我在这个混沌中，我尝试着去建立秩序，我尝试着在不确定性中去找确定性。我找到了一些踏脚石，一些临时的基点，我基于它看到了一些不一样的东西。

今天主要是想跟大家分享这些思考。我也期待看到大家眼里看到的这个视角，以及大家的见识，大家是怎么把精神立法的。我们可以共同交流学习探讨。

在我所看到的AI的星辰大海中，我们的探索才刚刚开始，这片天地确实是无边无际的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业