微信扫码
添加专属顾问
我要投稿
掌握大模型生成合法JSON的实用技巧,提升你的技术竞争力。核心内容:1. Prompt工程:通过示例输入输出对快速训练模型2. 解码约束:定义规则过滤生成的token以符合JSON格式3. 后处理校验:使用外部工具验证生成的JSON格式
后台回复“资料“领取整理好的面试题
要让大模型(如GPT、LLaMA、Claude等)稳定输出合法的JSON格式,需要结合 理论分析、Prompt工程、解码约束 和 后处理验证 等多方面技术。
通过提供输入-输出对(Few-Shot),模型能更快学习任务分布。
实践示例:
请严格按以下JSON格式回答,确保可直接被`json.loads()`解析:
示例1:
输入: "列出两种编程语言"
输出: {"languages": ["Python", "JavaScript"]}
示例2:
输入: "告诉我巴黎的人口和面积"
输出: {"city": "Paris", "population": 2148000, "area_km2": 105.4}
现在请回答:
输入: "提供三个颜色名称和其16进制代码"
输出:
约束解码的主要思想还是是在 LLM 生成每个 token 的过程中,根据提前定义号的规则对候选 token 进行过滤,只保留符合token。
假设我们构造一个 JSON 格式的数据,它包含 “name” 和 “age” 这两个属性,其中 “age” 属性的值必须为数字类型。
{ “name”: “Shuai”, “age”: 88 }
其约束规则可以这样描述:
以 { 符号起始
接着是 "name":
然后是一个被双引号包裹的字符串
紧接着是 ,
之后是 "age":
再跟着一个数字
最后以 } 符号结束
优势就是可以保证正确性,缺点就是效率太低了
可以使用一些外部工具来校验生产的是不是对的,如果不对就让LLM再次生成
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-17
从金字塔到哑铃:未来企业人才结构大变革
2025-04-16
AI Agent在HR领域的应用场景、潜力与局限
2025-04-16
Prompt:思维模型—自我分析与面试篇
2025-04-09
AI在招聘场景中的应用:AI凭什么敢对120万份简历说"绝不误伤任何人才"?
2025-03-28
第一批用Agent的HR,已经实现招聘自由
2025-03-25
从参会名单推测未来三年律师业务发展方向
2025-03-22
DeepSeek怎样赋能招聘猎头行业,猎聘/智联/领英/Boss
2025-03-22
在线面试“AI外挂”!编程问题秒出答案,完全绕过屏幕监控,连录屏都抓不到痕迹!
2025-01-05
2024-09-12
2024-08-03
2024-10-17
2024-07-25
2024-07-25
2024-07-31
2024-08-06
2024-06-03
2024-08-30
2025-04-23
2025-04-09
2025-03-13
2025-03-05
2025-01-24
2024-10-31
2024-09-12
2024-09-09