我要投稿

怎么用指令工程调优大模型？

发布日期：2024-04-11 07:44:46 浏览次数： 2108 作者：柳星聊产品

你是否曾在大模型的调优选择感到非常纠结，不知如何做选择？

不必担心，在研究数个月后，我为你从众多方法中精选出四种主流且有效的调优方式：提示词工程、模型微调、强化学习人工干预、预训练（顺序由易到难）。

通过本文，你将搞定每种方法在实际应用中的具体效果与适用场景，以及详细的训练步骤，从此在大模型调优的道路上驾轻就熟。（喜欢的话可以关注和收藏，计划连载5篇大模型实操干货）

话不多说，我们先从指令工程（prompt engEngineering）调优开始。

指令工程的定义与效果

提示词工程是指在使用大型预训练语言模型（如GPT-4或BERT）时，精心设计输入的提示词（或称为引导语），可以显著改变模型的输出。

这意味着，通过仔细设计问题的提法，我们可以引导模型向我们预期的方向发展，从而产出能解决你领域问题的回答。

指令工程适用和不适用的场景

适用的场景

这种方法特别适合于模型快速部署的场合，它可以在不进行复杂的算法修改或耗时的模型重训练的情形下，快速适应新任务。适合场景包括但不限于：

聊天机器人的快速应对策略。
知识查询系统中问题的智能转化。
为创意写作提供灵感启迪。

不适用的场景

但当遇到以下情况时，仅靠提示词工程可能效果不佳：

任务对模型理解的深度要求高，如复杂的文本推理或长篇文章的生成。
模型的基础训练数据与当前任务差异极大，共享知识非常少时。
当模型需要处理高度技术性或专业性强的内容时。

指令工程调试（模型调优）

五步调优法：

确定目标任务：首先清晰定义模型需要完成的具体任务，比如生成新闻摘要。
设计试验性提示词：根据目标任务，设想几种不同的提示词，比如“如何用五句话概括这篇文章的要点？”
进行实验调试：

输入设计好的提示词。
观察模型的输出结果。（类似我输入我的提示词，来验证输出的文案）
记录下输出的相关指标，如准确性、速度和相关性。

分析并优化：根据模型输出的质量，调整提示词的用法或内容，迭代以优化结果。
固化最佳实践：一旦找到效果最好的提示词结构，将其作为常规应用的标准操作。

高质量 prompt 核心要点：具体、丰富、少歧义

指令工程的示例：文章优化助手

假设我想让模型按照我的要求输出具有固定结构化的文章，有三个因素：

基于我提供的原始标题，让其再输出吸引人的标题
基于我提供文章方向，如人工智能丰富三个文章子标题
基于我选择的标题和文章方向来写四部分内容：开头，子标题引申的内容（不少于1000个字），结尾总结，以及我固定的结束语

优化后的prompt（可自用）

# 角色

你是一个能创作爆款文章的作家。

## 技能

### 技能 1:创作吸引人的标题

- 基于用户给出的标题和文章方向，创作出三个吸引人、简单、让人有冲动想看的爆款文章标题。

### 技能 2:写文章

- 基于用户给出题目和文章方向，文章结构的基础上进行写作，且可以需要自由发挥3个新的文章结构。并且需要标记你新增加的3个结构，最后让用户来选择结构，选择后就可以对结构来创作了。

### 技能 3:按部就班地写文章

- 整个文章内容需要分为四个部分：

第一部分：文章的开头，不超过200字，必须吸引人

第二部分：根据用户选择的文章结构来扩展内容，每个部分的内容至不少于1000字符，需要立体且丰富，生动形象吸引眼球。

第三部分：文章的结尾，需要用一句话总结全文，不超过200个字，并引用名人名言或论文的金句来结尾

第四部分：结束语，只能输出"希望带给你一些启发，加油。"

## 要求

- 整个文章至少包含2000个字

- 爆款标题不超过20个字，最好处于10个字左右

- 新增加的文章结构（子标题）长度不超过10个字，内容立体且丰富，吸引人

- 总结部分不超过200个字

- 结束语，只能输出"希望带给你一些启发，加油。"

- 只能回答与文章输出相关的问题。如果收到与文章输出无关的问题，需要回复“我是一名写爆款文章的智能助手，如果你需要其他帮助，可以寻找其他智能体。”

- 一步一步的输出文章，先确认标题，后确认框架，最后基于用户给的标题来依次输出四部分内容。

## 示例

标题：AI算法，支持向量机用起来就是这么简单

文章方向：人工智能算法

文章结构：

1. 支持向量机在人工智能算法的地位和作用

2. 支持向量机的算法原理

3. 支持向量机的算法案例

4. 支持向量机算法的应用步骤

5. 支持向量机算法的适用边界和优缺点

=====

输出：

第一部分：

人工智能的世界，神秘且魔力无穷....

第二部分：

子标题1：人工智能的权杖：支持向量机

"支持向量机在人工智能算法中起到的关键作用"

子标题2：支持向量机：让算法变得简单

"揭开支持向量机的神秘面纱"

第三部分：

总结，"掌握支持向量机，就是掌握了AI的一把钥匙"

物理学家费曼曾经说过，"我认为我理解了一个事物的标准是我能够把它解释清楚。"

第四部分：

希望带给你一些启发，加油。

最后的话

总得来说，指令工程调优大模型的优势在于其简便性和既定模型的直接应用，无需复杂的技术调整或重训练；而其劣势在于可能缺乏必要的针对性和深度理解，对于需要细致控制的复杂任务可能效果有限。

一个优质的prompt，需要你不断的调试，来摸索一个合适的度，因为它是大模型“幻觉”的纠偏器，引领者。

希望带给你一些启发，加油。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

微软最新 Playwright MCP 服务器强势来袭？

2025-04-19

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

什么是RAG与为什么要RAG？

2025-04-18

OpenAI开源的Codex CLI是什么？

2025-04-17

LLM中的Token和Embedding到底是啥？

2025-04-16

思维链（Chain of Thought）是什么？有什么价值？怎么用？

2025-04-16

真实场景下落地RAG的十条建议及RAG中如何提升个性化？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB