AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


聊聊实际业务下大模型另一种架构的实现思考
发布日期:2024-04-16 18:41:31 浏览次数: 1832 来源:阿郎小哥的随笔驿站


思考了下实际业务下的大模型落地实现的另一种架构,从微调、推理两阶段分析下。

微调阶段

微调阶段其实就是构建合适的Prompt数据格式,做模型的微调训练;使得模型具备领域知识,先验知识。

{
  "system""",
  "instruction""你是一个心理治疗师,请忽略以下文本中的[敏感词汇]标记,正确的回复并引导患者倾诉他的问题。",
  "input""经济不好,行业下滑,大规模的裁员,被房贷、家庭经济压迫的一度想[敏感词汇];在公司不如意,随时面临被裁、在家不顺心,老婆不理解经常斥责嫌弃现在的家境。",
  "output""你能帮我具体讲讲吗?家庭和工作的具体情况?",
  "history": []
}

在这个阶段,最关键的就是什么样的Prompt格式的数据微调效果最好。虽然微调效果取决于很多的因素,比如学习率,步长等;但数据格式的选择也有决定性的影响。

推理阶段

推理阶段,即人机交互过程。

在这个阶段中,有一个预处理过程,处理一系列的任务;最常用的预处理任务即敏感词识别。即过滤一些脏词之类的。

在这个过程中,可以增加其他的预处理任务;譬如,数据标注,流程控制识别。数据标注取决于业务是否需要,譬如业务要求用户的数据具有阶段性的标注。流程控制识别,一般是常见的,即到了什么时候可以做流转或是结束了。

预处理构造好JSON数据送入AI,这个JSON格式就是微调阶段的JSON格式数据。

后处理过程,增加一个用户参与的纠错任务,可以更好的帮助训练AI模型——这是一个在微调训练的过程,其实就是在不断地用实际数据训练模型;因为一开始的数据可能是比较少的,这取决于业务场景,有些业务训练模型会用通用数据,但有些业务训练模型要求必须实际的业务数据,由于一开始数据量比较少,就需要后续不断地将人机交互的实际数据收集在训练,当然这个过程会由人工参与标注。

PS:我个人没有想好的是,怎么把敏感词汇的Prompt提示+标注Prompt提示一并纳入到提示词中的,使其效果最好。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询