我要投稿

大模型技术知识点：Prompt

发布日期：2024-03-27 18:47:51 浏览次数： 3965

作者：数联未来

微信搜一搜，关注“数联未来”

一、什么是Prompt工程

Prompt工程，即提示工程，是人工智能领域中的一个新兴技术方向，它主要关注于设计和优化人机交互中的提示（Prompt）或指令，以更好地引导和激发大型语言模型（如ChatGPT、GPT-4等）生成高质量、符合用户意图的输出内容。

在人工智能助手或聊天机器人中，Prompt相当于用户给机器的指令或问题，它很大程度上决定了AI模型如何理解和回应用户的请求。良好的Prompt设计可以提高模型的表现，使得生成的回答更加准确、相关和有用。

Prompt工程的重要性在于：

提高输出质量：通过精心设计的Prompt，可以减少模型生成结果的随机性和不确定性，使其更贴合用户的实际需求。
明确上下文：为模型提供明确的上下文信息，帮助模型理解对话的背景、用户的意图以及回答的格式要求。
优化用户体验：有效的Prompt工程可以使得用户与AI的交互更加流畅自然，提升用户体验。
扩展应用场景：通过Prompt工程，可以使大型语言模型适应不同的应用场景，如文本摘要、实体提取、情感分析等。

在微软官方提供的教程中，可能会包含以下方面的内容：

系统消息：如何构建包含上下文、说明和格式要求的系统消息，来指导模型生成特定风格的回答。
少样本学习：在数据量有限的情况下，如何设计Prompt来优化模型的少样本学习能力。
非聊天场景：除了对话式应用，如何调整Prompt来适应非聊天场景，如图像描述、文本生成等。

Prompt工程作为AI领域的一个重要分支，正逐渐成为AI研发和应用中不可或缺的一环。随着技术的不断发展，Prompt工程的方法和技巧也将不断丰富和完善。

二、使用BERT进行文本分类的Prompt Learning案例

基于BERT做Prompt通常是指使用Prompt Learning技术来引导BERT模型进行特定任务的预测。Prompt Learning的核心思想是设计一个提示（Prompt），将原始任务转化为一个语言模型能够自然处理的文本补全任务。这样，我们可以利用BERT强大的语言表示能力来完成各种下游NLP任务，而无需对模型进行大规模的参数调整。以下是一个使用BERT进行文本分类的Prompt Learning案例，我们将情感分析任务转化为文本补全任务。

数据准备：首先，我们需要准备一些情感分析的数据。这里我们使用一个简单的例子：


sentences = ["这部电影很棒，我非常喜欢！", "这个产品太差了，我非常不满意！"]

labels = ["正面", "负面"]复制代码

Prompt设计：接下来，我们需要设计一个Prompt模板，将原始句子转化为补全任务。例如：

prompt_template = "这句话的情感是：[MASK]。"
复制代码

数据转换：使用Prompt模板将原始数据转化为补全任务的数据：


prompt_data = []

for sentence, label in zip(sentences, labels):

prompt = prompt_template.replace("[MASK]", label)

prompt_data.append(prompt + sentence)复制代码

BERT模型加载：接下来，我们需要加载预训练的BERT模型：


from transformers import BertTokenizer, BertForMaskedLM



tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')

model = BertForMaskedLM.from_pretrained('bert-base-chinese')复制代码

模型预测：使用BERT模型对Prompt数据进行预测，得到[MASK]位置的预测结果：


from torch.nn.functional import softmax



for prompt in prompt_data:

input_ids = tokenizer.encode(prompt, add_special_tokens=True, return_tensors='pt')

with torch.no_grad():

outputs = model(input_ids)

logits = outputs.logits

mask_pos = torch.where(input_ids == tokenizer.mask_token_id)[1]

mask_logits = logits[0, mask_pos]

mask_probs = softmax(mask_logits, dim=0)

pred_label = tokenizer.decode(mask_pos[mask_probs.argmax()])

print(f"预测结果: {pred_label}")复制代码

在这个例子中，我们使用BERT的Masked LM头来预测[MASK]位置的token。通过设计合适的Prompt模板，我们可以将原始的情感分析任务转化为BERT擅长的文本补全任务。这样，我们就可以利用BERT的强大语言表示能力来完成各种下游NLP任务，而无需对模型进行大规模的参数调整。

需要注意的是，这个例子只是一个简单的演示，实际应用中可能需要更复杂的Prompt设计和模型调整。此外，Prompt Learning技术在NLP领域仍然是一个活跃的研究方向，有许多不同的Prompt设计方法和技巧。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeek V3.1 Base / Instruct 发布

2025-08-20

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

有点东西！Qwen开源会写中文的生图模型Qwen-Image

2025-08-05

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

DeepSeek-V3.1-Base来了！MoE架构+128K上下文，性能再进化

2025-08-20

WAIC 2025 观察：大模型进入“效率与场景”决胜期

2025-07-29

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

大家都在问

几乎都在挂羊头卖狗肉，AI Agent的泡沫现在到底有多大？

2025-10-20

AIOps探索：做AIOps智能体，是直接调用公共大模型还是要部署私有大模型？

2025-10-20

Agent 热潮下，语料如何成为 AI 落地与 ISV 变现的关键燃料？

2025-10-19

一文搞懂SFT vs RLHF：阿里、字节、腾讯都怎么用?

2025-10-18

Claude Skills 会替代 MCP 吗？

2025-10-18

从spec-kit到OpenSpec：规格驱动开发如何解决项目迭代痛点？

2025-10-18

大模型会替代搜索引擎么?

2025-10-16

OpenAI“隐秘客户榜”曝光：谁在烧掉上万亿Token？

2025-10-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

	sentences = ["这部电影很棒，我非常喜欢！", "这个产品太差了，我非常不满意！"]
	labels = ["正面", "负面"]

	prompt_data = []
	for sentence, label in zip(sentences, labels):
	prompt = prompt_template.replace("[MASK]", label)
	prompt_data.append(prompt + sentence)

	from transformers import BertTokenizer, BertForMaskedLM

	tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
	model = BertForMaskedLM.from_pretrained('bert-base-chinese')

	from torch.nn.functional import softmax

	for prompt in prompt_data:
	input_ids = tokenizer.encode(prompt, add_special_tokens=True, return_tensors='pt')
	with torch.no_grad():
	outputs = model(input_ids)
	logits = outputs.logits
	mask_pos = torch.where(input_ids == tokenizer.mask_token_id)[1]
	mask_logits = logits[0, mask_pos]
	mask_probs = softmax(mask_logits, dim=0)
	pred_label = tokenizer.decode(mask_pos[mask_probs.argmax()])
	print(f"预测结果: {pred_label}")