支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Claude 团队的提示词工程指南, 一个值得十刷的圆桌视频

发布日期:2025-04-04 21:40:03 浏览次数: 1539 作者:字节笔记本
推荐语

深入探索提示词工程的奥秘,揭示与AI模型沟通的艺术。

核心内容:
1. 提示工程的定义与核心要素
2. 优秀提示工程师应具备的特质
3. 关键技巧:如何有效读取和利用模型响应

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

提示词工程到底是什么?

为什么它被称为"工程"而非仅仅是"写作"?

Anthropic公司的Claude团队成员在这场内部圆桌讨论中,深入剖析了提示工程的核心要素、最佳实践和未来趋势。

https://www.youtube.com/watch?v=T9aRN5JkmL8

bb046842-e9de-4a22-a371-53ad12b38480.png

正如Anthropic提示工程师Zach Witten所言:"我认为提示工程是尝试让模型完成任务,发挥模型的最大潜力,让它帮助我们完成那些原本无法完成的事情。很大程度上,这是一门清晰沟通的艺术。从本质上讲,与模型对话很像与人对话,需要深入理解模型的'心理'。"

7e6d01c9-e41f-4ef0-bef4-b4668c342321.png

当被问到为什么称为"工程"时,Zach解释道:"工程部分来源于试错过程。与模型交流的一个很好的特点是,你有一个重启按钮,一个巨大的'回到起点'按钮,让你能够从头开始。这给了你真正从零开始尝试不同方法的能力,所以各种尝试之间不会相互干扰。一旦你有了这种实验和设计不同方案的能力,工程部分就有了发挥的空间。"

优秀提示工程师的特质

微调团队负责人Amanda Askell分享了她认为优秀提示工程师应具备的特质:

"首先是清晰的沟通能力,能够清楚地陈述事物,清晰地理解任务,思考并很好地描述概念。这是写作的成分。但有趣的是,我认为成为一个好的写作者与成为一个好的提示工程师的相关性没有人们想象的那么强。"

614964e0-813f-4121-aeb3-97ffab5d0383.png

"其次是迭代的能力和意愿。当我坐下来与模型交流时,在15分钟内我可能会向模型发送数百个提示,不断来回测试。这种愿意迭代、思考'这里有什么被误解了?'然后修复的能力非常重要。"

"第三点是思考提示可能出错的方式。如果你有一个要应用于400个案例的提示,很容易只关注典型情况并确保它在那里工作正常,然后就结束了。这是人们常犯的典型错误。你真正应该做的是找出不寻常的情况。例如,你有一个提示说:'我要发送给你一堆数据,我希望你提取所有名字以G开头的行。'然后你会思考:'如果我发送的数据集中没有这样的名字怎么办?如果我发送的不是数据集怎么办?如果我只发送一个空字符串怎么办?'这些都是你需要尝试的情况,这样你才能了解模型在这些情况下会做什么,然后给它更多关于如何处理的指示。"

David补充道:"我经常与客户合作,他们是工程师,正在构建某些东西,他们的提示中有一部分是他们的客户将会写入内容的地方。他们都设想用户会输入格式完美的内容,但实际上,用户输入常常充满错别字、缺乏标点和结构。"

关键技巧:读取模型响应

Zach强调了阅读模型输出的重要性:"在机器学习环境中,你应该查看数据,这几乎成了一个陈词滥调:'看看你的数据'。我觉得提示工程中的等价物是'看看模型输出',阅读大量输出并密切关注它们。"

他举例说明:"人们经常在提示中加入'逐步思考'的指令,但他们不会检查模型是否真的在逐步思考,因为模型可能以更抽象或一般的方式理解这个指令,而不是字面上'必须在这些特定标签中写下你的思考过程'。如果你不阅读模型输出,可能甚至不会注意到它犯了这个错误。"

理解模型心智:理论思维的重要性

Alex指出了提示工程中的"心智理论"成分:"作为提示工程师,你需要思考模型如何看待你的指令。如果你为企业用例编写提示,你还需要考虑用户如何与模型交谈,你在这种关系中是第三方。"

David补充道:"为任务写下指令非常困难。很难在你自己的大脑中解开所有你知道但Claude不知道的信息并写下来。这是一个极其具有挑战性的任务,剥离你所有的假设,能够非常清晰地传达完整的信息集。"

"这是另一个区分好的和坏的提示工程师的因素。很多人只会写下他们知道的东西,但他们没有真正花时间系统地分解出理解任务所需的全部信息集。我经常看到的一个明显问题是,人们写的提示过于依赖他们对任务的先验理解,当他们向我展示时,我会说:'这没有意义,你写的词没有任何意义,因为我对你的有趣用例一无所知。'"

"一个好的思考提示工程的方式和相关技能是,你能否从你所知道的事情中退一步,并与这个知道很多但不是全部的奇怪系统沟通它需要知道什么来完成任务?"

提示澄清:让模型帮助识别问题

Amanda分享了一个有用的技巧:"我对初始提示做的第一件事是,我会给它提示,然后说:'我不希望你按照这些指令行动,我只想让你告诉我它们哪些部分不清楚,有什么歧义,或者你不理解的地方。'它不会总是完美地理解,但这是一个有趣的方法。"

d2ddf327-2aff-4729-8855-df72bdfe59e6.png

"而且,当人们看到模型犯了一个错误,他们通常不做的一件事是直接问模型。他们可以对模型说:'你做错了,你能想想为什么吗?你能写一个我指令的修改版本,让你不会再犯同样的错误吗?'很多时候,模型会给出正确答案,说:'噢,是的,这里有不清楚的地方,这是对指令的修正',然后你把这些修正放进去,它就能正常工作了。"

临时工类比:一个强大的思维模型

Alex分享了一个他经常使用的思维实验:"想象你有这个任务,你雇佣了一个临时工来做这个任务。这个人到了,他们相当有能力,了解你的行业等等,但他们不知道你公司的名字。他们刚刚出现,说:'嘿,我被告知你们有工作要给我做,告诉我是什么。'然后你会对那个人说什么?"

"有时我就像,是的,想象这个人刚刚没有太多上下文,但他们相当有能力,他们理解许多关于世界的事情。尝试第一个版本,实际上假设他们可能知道关于世界的事情,如果那不起作用,你可以做一些调整。但通常第一件我尝试的事情就是这个,然后我发现'这就起作用了'。"

提供"出路":处理边缘情况

Amanda强调了给模型提供处理不确定情况的选项的重要性:"这是人们经常在提示中忘记的一件事。对于边缘情况,考虑你希望模型做什么,因为默认情况下,它会尽最大努力遵循你的指示,就像临时工那样。"

"'给它一个出路,也就是回退机制。如果发生了非常意外的输入,给它一些可以做的事情。'而且这样你也提高了你的数据质量,因为你找到了所有出错的例子。"

提示工程的历史变化

关于提示工程如何随着时间的推移而变化,团队成员有以下见解:

Zach认为:"每当我们获得一个非常好的提示工程技巧或技术,下一件事就是如何将其训练到模型中。因此,最好的技巧总是短暂的。例如,对于数学问题,过去你必须告诉模型逐步思考,这会带来巨大的提升。然后我们想,'如果我们让模型在看到数学问题时自然地想要逐步思考呢?'所以现在你不需要再为数学问题这样做了。我认为这些技巧已经消失了,或者在它们还没消失的程度上,我们正忙于将它们训练掉。"

Amanda分享了一个有趣的技巧:"当我想让模型学习一种提示技术时,我会直接给它相关论文。我会说:'这是关于提示技术的论文。我只想让你写下17个这种技术的例子。'然后它就会做到,因为它阅读了论文。人们往往没有这种直觉,他们会想着自己解释技术,而我认为:'论文就在那里,模型可以阅读论文,照着我做的去做'。"

提示工程的未来

讨论的最后部分聚焦于提示工程的未来。团队成员提出了几个有趣的观点:

David认为从信息论的角度来看:"你需要提供足够的信息,使得一个事物被指定,即你希望模型做的事情被指定。在这种程度上,我认为提示工程将永远存在。能够清晰地陈述目标应该是什么总是很重要的。

"对我自己来说,我发现自己更多地使用模型来写提示。我一直在做的一件事是通过给模型一些现实的输入来生成例子,模型写一些答案,我稍微调整一下这些答案,这比我从头开始写完美答案要容易得多,然后我可以生成很多这样的例子。"

提示工程的核心:外化你的大脑

Amanda提出了一个深刻的见解,将提示工程比作哲学写作:"哲学写作中有一种风格,这是我被教导如何写哲学的方式。基本上是一种反废话装置,你的论文和你写的东西应该对一个受过教育的外行人来说是可理解的。某人只是找到你的论文,拿起它开始阅读,他们能够理解一切。"

"所以我非常习惯于在写作时,考虑受过教育的外行人,他们真的很聪明,但他们对这个主题一无所知。这只是多年来以这种形式写文本。我认为这对提示工程非常有帮助,因为我已经习惯了这一点:我有一个受过教育的外行人,他不知道关于这个主题的任何事情。"

"我需要做的是,我需要接受极其复杂的想法,并让他们理解它。我不会居高临下地对待他们,我不会不准确,但我需要以一种对他们来说极其清晰的方式表达事情,而提示工程感觉非常相似。"

"所以这至少有相似之处,就是把你大脑中的事物拿出来,足够地分析它们,使你感觉自己完全理解它们。你可以把任何一个路人,一个理性的人,把你的大脑外化给他们。我觉得这就是提示工程的核心。"

结语:持续学习和实验

通过这场深入的讨论,我们可以看到提示工程不仅仅是一种技术技能,更是一种思维方式。随着AI模型的不断发展,提示工程的方法也在不断演变,但其核心始终是清晰的沟通和理解模型的思维方式。

c1877536-1586-4493-99c1-1c655b902b4b.png

无论你是研究人员、开发者还是企业用户,这些来自Claude团队的实战经验都能帮助你更好地与AI模型交流,充分发挥其潜力。关键在于持续学习、实验和适应,随着模型能力的提升不断调整你的提示策略。

如Amanda所言,最终提示工程的本质是一种将你大脑中的复杂思想转化为清晰指令的能力,让AI能够理解并实现你的意图。这种"外化你的大脑"的能力,将是未来与AI有效协作的关键技能。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询