我要投稿

通过prompt让大语言模型更好地输出结构化的内容，是通往复杂应用的基石

发布日期：2024-10-28 21:56:03 浏览次数： 4632

作者：草台AI

微信搜一搜，关注“草台AI”

在基于大型语言模型的应用开发中,AI生成的输出通常需要进行后处理才能投入实际使用。为此,结构化输出扮演着关键角色 - 它为大语言模型提供了标准化的数据接口,不仅确保了数据的一致性和可靠性,更是构建复杂系统的基石。通过结构化输出,大语言模型得以作为更大系统中的可信赖组件,实现无缝集成。

本文分享了一些常见的让大模型输出结构化内容的方法

只需要将下文所给的片段添加到你们自己的提示词中即可，在GPT和Claude下效果都很不错。

一些总结

• ?不同模型对prompt格式的偏好不同
    ◦ ?GPT和Gemini更喜欢markdown
    ◦ ?Claude更喜欢XML
• ⚡关于流式
    ◦ ⏱界面上需要快速响应的场景
    ◦ ❌XML, Json, 等需要标签闭合的场景不太适合流式 (强行也能写，就是麻烦了)，可以考虑Jsonl、markdown、bullet list、自定义格式等可以边输出边解析的格式
• ?使用方法
    ◦ ?将下面的OUTPUT INSTRUCTIONS拼接到原始prompt中即可，建议放到输入之前
    ◦ ?️如果还是有边缘场景，再增加一个EXAMPLE约束，给三五个示例：输出示例，或者是输入-输出示例
        ▪ ?可以在prompt中拼接
        ▪ ?‍?‍?也可以通过role=user, role=assistant来组织
    ◦ ?使用Prefill技巧， 比如 "接下来输出markdown:",  "接下来输出json, {"
        ▪ ?可以在prompt中拼接
        ▪ ?‍?‍?也可以通过role=user, role=assistant来组织
    ◦ ⚠️如果还是不行，先通过prompt确保输出范围可控，再到代码中增加正则表达式兜底
    ◦ ?最后再不行就要考虑重试和界面报错
    ◦ ?工程上还能做的事情
        ▪ ?考虑使用更小的temperature
        ▪ ?使用logit_bias参数严格控制输出范围和概率

一些开箱即用的片段OUTPUT INSTRUCTIONS

自由 markdown

OUTPUT INSTRUCTIONS

• 你的输出必须只使用标准 Markdown 格式
• 不要包含警告、注释或任何额外信息；只输出要求的部分
• 不要重复想法、引用、事实或资源
• 不要用相同的开头词语开始条目
• 根据需要使用适当的 Markdown 语法来格式化标题、列表、链接、图片和其他元素
• 确保创建输出时遵循所有这些指令

限定分组的 markdown

OUTPUT INSTRUCTIONS

• 你的输出必须只使用带项目符号列表的标准 Markdown 格式，组织成特定部分："##### 摘要"和"##### 要点"
• 不要包含警告、注释或任何额外信息；只输出要求的部分
• 不要重复想法、引用、事实或资源
• 不要用相同的开头词语开始条目
• 每个部分应以粗体标题开始，列表项目应在各自标题下方
• 确保创建输出时遵循所有这些指令

markdown 项目符号列表

OUTPUT INSTRUCTIONS

• 你的输出必须只使用带项目符号列表的标准 Markdown 格式
• 不要包含警告、注释或任何额外信息；只输出要求的部分
• 使用项目符号列表输出，不使用编号列表
• 不要重复想法、引用、事实或资源
• 不要用相同的开头词语开始条目
• 确保创建输出时遵循所有这些指令

markdown 有序列表

OUTPUT INSTRUCTIONS

• 你的输出必须只使用带有序列表的标准 Markdown 格式
• 不要包含警告、注释或任何额外信息；只输出要求的部分
• 不要重复想法、引用、事实或资源
• 不要用相同的开头词语开始条目
• 使用有序列表来组织输出，每个条目以数字和点开始(如"1."、"2."、"3."等)
• 确保创建输出时遵循所有这些指令

markdown 表格

OUTPUT INSTRUCTIONS

• 你的输出必须只使用带表格的 Markdown 格式
• 不要包含警告、注释或任何额外信息；只输出要求的部分
• 不要重复想法、引用、事实或资源
• 不要用相同的开头词语开始条目
• 使用 Markdown 语法构建表格。以表头行开始，然后是分隔行，最后是数据行。每列应用竖线(|)分隔
• 确保创建输出时遵循所有这些指令

YAML

OUTPUT INSTRUCTIONS

• 你的输出必须只是标准 YAML 对象
• 不要包含警告、注释或任何额外信息；只输出要求的部分
• 不要重复想法、引用、事实或资源
• 不要用相同的开头词语开始条目
• 确保创建输出时遵循所有这些指令

json

需配合具体业务场景，在 Example 给出详细字段说明和示例,或者给出 json schema:
## JSON 示例
{
    "key1": "value1", 
    "key2": "value2",
    "key3": {
        "subKey1": "subValue1",
        "subKey2": "subValue2"
    }
}