我要投稿

探索大型语言模型与基础提示技巧

发布日期：2024-04-06 18:33:28 浏览次数： 2348 作者：草台AI

本文要点

LLMs 是下一词预测的机器
精通一致的格式与组织以实现有效的提示构建
为LLM提示构建有效示例
上下文限制及其对提示工程的影响
精通AI提示中的风格艺术

LLMs 是下一词预测的机器

引言

欢迎来到 大型语言模型（LLMs） 的神奇世界，以及提示技巧的基础知识领域！在本课程的第一章，我们将深入探讨LLMs的真正本质。剧透警告：它们本质上是下一词预测的机器。这听起来可能颇为简单，但其实它们的能力远不止于此。无论你是编程的新手，还是对这些技术奇迹的运作方式感到好奇，你都来对地方了。让我们携手踏上这段激动人心的探索之旅，从LLMs的核心功能入手，逐步揭开它们的神秘面纱。

理解LLMs 作为下一词预测的机器

设想你正在撰写一条短信或电子邮件，而你的手机自动弹出下一个你可能想要输入的词汇。这就是大型语言模型（LLMs）所做工作的最基本示例。但是，像 GPT-3.5、GPT-4（即人们熟知的 chatGPT）、Claude 2 和 LLaMA 这样的LLMs，它们就如同词汇预测领域的超级英雄。它们不仅能预测句子中的下一个词，还能基于已接收的输入生成连贯且有意义的长篇文本。它们通过连续预测下一个词来延续已有文本。

在LLMs的核心，是对海量文本数据的分析。通过这种分析，模型学习到了语言的模式、细微差别以及结构。这使得它们能够预测出在一系列词汇中自然接续的下一个词。可以将其比作是一场规模宏大、速度惊人的“填空游戏”。

LLMs是如何进行预测的？

你可能会好奇LLMs是如何实现这些预测的。其实，这一切都源于它们的训练过程。LLMs在训练期间会接触到包含各类教科书、文章、网站等的庞大数据集。在这一阶段，它们学习理解语言的上下文和流畅性，掌握语法、风格乃至文本的语调等元素。

当你向LLM提供一个句子或问题作为提示时，它会运用所学知识来预测最可能跟随的下一个或几个词。这并非随意猜测，而是基于其在训练过程中观察到的模式和规则进行的深思熟虑的预测。

尝试一些提示工程

考虑到LLMs的概率本质，提示工程师面临的挑战是如何尽可能一致地引导LLMs达到高度可预测和精确的结果。

在这门课程中，你将学习到许多技巧，它们将帮助你掌握高度可预测的LLM输出的艺术与科学。但在深入之前，让我们先从一些简单的练习开始，激活我们的思维。

精通一致的格式与组织以实现有效的提示构建

引言

在本课程中，我们将探讨在为《大型语言模型（LLMs）》构建提示时，保持一致的格式和组织的重要性。你可能会好奇，提示格式这样看似简单的事物如何能显著影响你从AI收到的回应。正如在人类沟通中一样，清晰和结构在确保你的请求被理解并准确执行中扮演着至关重要的角色。让我们深入探讨如何应用这些原则，使你与LLMs的互动更加有效和可预测。

一致格式的重要性

一致地格式化你的提示不仅仅是为了让它们看起来整洁；这意味着要向AI清晰地传达你的意图。想象一下，如果你在给别人烘焙蛋糕的指导，但没有按顺序列出步骤，而是将它们全部混乱地堆砌在一起。结果会怎样？混乱，很可能是一个不太美味的蛋糕。同样的原则也适用于LLMs。通过以清晰、有结构的方式呈现你的提示，你将极大地增加获得期望输出的机会。

虽然有许多方法来构建你的提示，但在本课程中，我们将教你由Prompt Engineers和CodeSignal的AI专家开发的Markdown提示框架（MPF）。

MPF是一种非常有效的创建高度可读、易于维护和有效的提示的方法，并且是Cosmo许多方面的核心技术。

Markdown提示框架（MPF）

在整个课程中，我们将看到许多MPF应用的例子，但现在，这里是一个高层次的总结：

像这样将你的提示分割成Markdown部分：SECTION

这不仅有助于LLMs更好地理解你的提示，而且使你的提示非常容易快速浏览（特别是当以Markdown渲染时，因为这些会以粗体显示），允许你的AI工程师同行在提示变得庞大时轻松找到并阅读相关部分。

从提示顶部开始你的ASK部分

这让你和你的合作者能够从一开始就快速理解提示的目标。

将每个部分格式化为Markdown项目符号列表，使它们更易于阅读和理解。

项目符号列表更容易快速浏览，并且它们倾向于引导LLMs更好地遵循指令。

尽管要尽量减少部分的数量，对于复杂的提示，包括以下关键部分：

`ASK` - 我们要求LLM做什么？
`CONTEXT` - LLM需要知道什么才能准确回应？
`CONSTRAINTS` - 在回应时需要遵循哪些限制？
`EXAMPLE` - 你满意的输出的一个好例子是什么？

应用MPF的示例

来看一个格式不佳的提示：

写一个关于宇航员发现新星球的短篇故事。但要确保故事中包括一个会说话的外星人，一场太空战斗，以及最后揭示一切都是模拟的转折。噢，请控制在100字以内。

使用MPF，我们可以将这个提示转变为一个结构良好、易于消化的模型请求：

__ASK__Craft a short story about an astronaut's discovery.创作一篇讲述宇航员探索发现的短篇故事。__CONTEXT__- The setting is outer space.- 故事发生在外太空。- The protagonist is an astronaut.- 故事的主人公是一名宇航员。__CONSTRAINTS__- The story should be no longer than 120 words.- 故事长度不超过120字。- Include the following elements:- 故事需包含以下元素：  - A talking alien.  - 一位能够交谈的外星人。  - A space battle.  - 一场激烈的太空战斗。  - A twist ending revealing everything was a simulation.  - 以一个大揭秘作为结局，展现一切实际上都是一场模拟。

虽然大多数强大的模型都能轻松理解上述任一提示，并返回类似下面的结果，但当你的提示变得更大更复杂，或者如果你需要使用一个不那么强大的LLM时，MPF方法对于成功的提示工程变得至关重要。

在繁星之中漂浮，宇航员Luna凝视着她面前展开的银河芭蕾。她的任务：探索未知。突然，一艘外星飞船接近，其形态闪烁着未知的能量。走出了Zorax，一个嘴唇从未动过，但它的声音充满了Luna的脑海，提供了星星的智慧和即将到来的太空战斗的警告。
随着星际战斗机在令人眼花缭乱的壮观中交战，Luna勇敢地与她的新盟友并肩作战。但当尘埃落定时，宇宙变成了黑色，揭示了一个模拟舱。"训练完成，"一个机器人的声音宣布。Luna走了出来，心跳加速，准备迎接真正的冒险。

进入实践

现在你已经了解了格式化的重要性和Markdown提示框架的原则，你已经准备好实践你所学的内容了。

以下的实践将帮助你加强对材料的理解，并为你提供编写大型语言模型有效提示所需的技能。记住，熟能生巧，所以当你继续与这些模型合作时，你将变得更擅长于制作高效有效的提示。

为LLM提示构建有效示例

引言

欢迎来到关于“优秀示例的重要性”的课程，这是我们深入了解大型语言模型（LLMs）及基础提示技巧之旅的一部分。随着我们更深入地挖掘LLMs的力量，越来越明显的是，我们为这些模型提供的示例显著影响了它们生成的输出的质量和相关性。本节强调了精心构建的示例在提示设计中的关键作用，最终影响了模型理解任务和提供精确结果的能力。

示例在提示LLMs中的作用

示例是与LLMs有效沟通的基石。当我们设计提示时，我们不仅仅是在提问或提出请求；我们是在引导模型朝着期望的响应前进。通过提供清晰、相关的示例，我们帮助模型理解任务本身，以及输出的上下文和期望格式。

让我们来看一个简单的提示，我们想要创建一个没有示例部分的电子邮件模板。

__ASK__Create short advertising copy to market CodeSignal创建简短的广告文案来推广CodeSignal__CONSTRAINTS__- Do not focus too much on features, focus on brand.- 聚焦品牌形象而非详细功能。- Keep the ad very short.- 广告内容要精简至极。

这是通过Claude运行此提示后的一个示例输出。

这里是CodeSignal的一段简短广告文案草稿：CodeSignal。编程与机遇的交汇点。

虽然这已经相当不错了，你会注意到有一个不必要的前言，而且格式也不是很好。另外，假设我们希望能够轻松地复制粘贴这些内容，并且不希望响应周围有引号。

优秀示例的影响

现在我们可以添加许多额外的限制来修正提示，但更简单的方法是添加一个清晰的示例，如下所示：

__ASK__Create short advertising copy to market CodeSignal撰写简洁的宣传文案，以推广CodeSignal__CONSTRAINTS__- Do not focus too much on features, focus on brand.- 不必过度强调功能特点，而应聚焦品牌形象。- Keep the ad very short.- 广告文案要极其简短。- Follow the format of the example closely.- 严格按照示例的风格来编写。__EXAMPLE__Build tech skills top companies are hiring for.培养顶级公司争相招聘的技术能力。

这返回了Unlock your coding potential. Shine with CodeSignal.，这更接近我们想要的结果。

结论

优秀的示例不仅仅是附加品；它们对于设计有效的LLM提示至关重要。它们引导模型满足我们的期望，并显著影响生成内容的质量。随着我们继续探索LLMs和提示工程的领域，请记住一个精心挑选的示例的力量——它可能是良好输出与优秀输出之间的差异。

上下文限制及其对提示工程的影响

引言：上下文限制及其影响

在大型语言模型（LLMs）的世界中，理解上下文限制至关重要。无论你是在使用GPT-3.5、GPT-4、Claude 2还是LLaMA，所有这些模型在生成响应时考虑文本的数量都有一个特定的限制。这个限制通常影响着提示的设计方式，理解这一点可以显著改善你与LLMs的互动。本课程将阐明上下文限制是什么，它们是如何演变的，以及应对这些限制的实用方法。

理解上下文限制

上下文限制指的是LLM在生成响应时能考虑的最大文本量。例如，截至最后一次更新，GPT-3.5的上下文窗口大约为4096个tokens(标记)。

例如，本课程大约有500个单词和650个tokens。

重要的是要认识到，token不仅仅是一个单词，如上图所示。它可以是一个单词、单词的一部分或标点符号。这意味着模型实际可以考虑的文本可能比你最初预期的要短，尽管作为一个大致的经验法则，将tokens视为单词是可以的。

上下文限制的历史演变

随着时间的推移，上下文限制的增强进程非常显著。以下是简化的表格，说明了这些变化：

模型	上下文窗口（tokens）
GPT-3	2k
GPT-3.5	4k
GPT-4	4k-32k
Mistral 7B	8k
PALM-2	8k
Claude 2	100k

这种演变为生成连贯且内容丰富的响应提供了更多机会。然而，大多数LLM提供商都是按使用的tokens数量收费的，而且你通常在使用的模型并没有很大的上下文窗口，因此你需要策略来优化你的提示，以应对这些限制。

克服上下文限制的策略

导航LLMs的上下文限制需要策略性地设计提示和理解内容压缩。以下是克服这些限制的方法：

提示压缩：简化你的提示，只包含最必要的信息。这涉及到将冗长的背景或上下文总结为保留核心信息的简洁陈述。
聚焦查询：不要提出宽泛、不集中的问题，而是要明确你的询问。具体的问题往往能在上下文限制内产生更准确和相关的响应。
迭代提示：将复杂任务分解为更小、更连续的提示。通过迭代地完善查询，你甚至可以在严格的token限制下引导LLM经历一个逻辑思考的序列。

结论

虽然上下文限制可能看起来像是重大的限制，但它们也鼓励我们成为更周到、更有效的沟通者。随着LLMs的不断发展，我们与它们互动的策略也将继续进化。通过理解上下文限制的影响，并相应地调整我们的提示设计，我们可以制定出精确的提示，产生相关、高质量的输出。

精通AI提示中的风格艺术

引言

在本课程中，我们将探讨如何与大型语言模型（LLMs）有效沟通，以在我们的提示中实现特定的风格效果。掌握这项技能对于制作更定制化、精确和一致结果的提示至关重要。无论你的目标是创建专业文档、富有想象力的故事，还是介于两者之间的任何内容，理解风格规范都将增强你的提示工程能力。

理解风格规范

想象风格规范是向一位技艺高超的厨师下达指令的过程。就像你会指定你希望牛排的熟度一样，你可以指导LLMs产生你所期望的文本“风味”。风格可以包含各种元素，包括语调（正式、非正式）、语言（简单、技术性）和长度（简短、详细）等。

例如：

__ASK__Generate a motivational quote for a team newsletter. 为团队通讯创作一句励志名言。__STYLE__- Tone: uplifting and visionary. - 语调：鼓舞人心、富有远见。- Language: simple and accessible. - 语言：简洁明了。- Length: short.- 长度：简短。

"每一个挑战都是我们共同成长的机会。让我们带着勇气拥抱我们的旅程，并将我们的努力团结起来，朝着充满成功的未来前进。记住，团队的力量在于每个成员，每个成员的力量在于团队。"

如果你简单地从提示中移除Length: short部分，你会得到一个明显不同的输出：

"单独行动，我们能做的很少；团结一心，我们能做的很多。让我们利用我们的集体力量、梦想和抱负。我们面临的每一个挑战都是一个共同变得更强大的机会。记住，不仅仅是为了到达顶峰；而是为了我们共享的旅程和我们建立的联系。让我们携手前进，朝着我们的共同愿景。因为当我们团结一致时，没有什么是我们做不到的。"

语调在提示中的作用

语调在决定你的提示的感知和你收到的响应类型中起着重要作用。设定明确的语调有助于指导LLM生成与你期望的情感或专业背景相一致的响应。

示例：

__ASK__Write a brief overview of renewable energy sources. 撰写一篇关于可再生能源的简明概览。__STYLE__Tone: Informative but easy to understand.风格：既要信息详实，又要浅显易懂。

这个示例中的语调指令提示LLM在平衡专业信息传递与可访问性之间做出调整，确保内容对受众来说不会过于技术化。

语言和复杂性

特别是当你的受众专业水平差异很大时，指定期望输出的语言和复杂性至关重要。这种规范可能涉及根据你的目标读者要求使用简单或技术性的语言。

示例：

__ASK__Explain how solar panels convert sunlight into electricity. 请解释太阳能电池板是如何把阳光转换成电能的。__STYLE__Language: Simple, for a general audience.用词需简洁明了，适合广大非专业观众理解。

这个提示指导LLM使用通俗易懂的术语，从而使复杂技术对没有技术背景的人也能理解和接受。

长度和细节

最后，指定长度和细节水平可以极大地影响你的沟通效果。这个过程可能涉及要求简洁的摘要或详细的解释。

示例：

__ASK__Summarize the benefits of using electric vehicles.概括使用电动汽车的益处。__STYLE__Length: Brief, two sentences.篇幅：简洁，限两句话。

注意，在Length部分我们非常具体地要求了两句话的长度，因为有时简短或长可能是相对的，难以理解。

结论

理解和利用风格规范可以成为提示设计和发展的强大工具。就像雕塑家通过凿子揭示内在形态一样，在你的提示中指定风格有助于将输出塑造成你所设想的精确形态。

看，你已经快要完成这门课程，准备好作为一名提示工程师踏上你的旅程了。我相信还有很多要学习的东西，但这门课程应该为你提供了一个坚实的基础，引导你在那个旅程中前进。在我们结束之前，让我们再做一些练习。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业