我要投稿

大型语言模型场景调优实践｜打造「贺岁灵感模型」

发布日期：2024-04-12 12:14:58 浏览次数： 2033 作者：NLP工作站

写在前面

ChatGPT模型问世后，立刻在全球范围内掀起了轩然大波，其卓越的效果引发了新一轮AI浪潮。目前以ChatGPT、文心一言等为首的一系列大型语言模型给广大用户带来了极大的便捷。

例如：编辑们可以借助大型语言模型的能力进行文案创作及润色，程序员们可以借助大型语言模型能力进行代码辅助生成等；尤其在多模态大型语言模型出现后，很多人都变成了绘画大师，只需要输入一些文本描述，大型语言模型就可以生成对应的图片内容。

但大型语言模型距离真正地落地，其实还有一段艰难的路要走。目前大型语言模型在通用领域上效果还不错，但在一些特殊或者小众的领域&场景上效果往往不是很理想。

因此需要在领域数据或场景数据上对通用大型语言模型采用继续预训练、指令微调、人类偏好对齐等手段，将通用大型语言模型领域化、垂直化、行业化、场景化、个性化，这样可以在不丧失原有大型语言模型能力的基础上，进一步提高模型在特定领域或场景上的效果。

恰巧春节假期期间，我注意到百度智能云发起了【千帆杯AI原生应用开发挑战赛】，正是给大家提供了一次打造场景专属大型语言模型的机会。

百度智能云千帆杯第二期赛题是《贺岁灵感模型》，赛题聚焦于春节假期贺岁时刻的精彩“文笔”展示，旨在构建一个能在春节期间帮大家激发无限创意的模型，让你在贺岁期间大显身手。赛题借助百度智能云千帆大模型平台（千帆Modelbuilder），参赛者可以在平台上快速进行数据管理、模型调优以及模型部署，让参赛者更加方便、快捷地打造出领域、场景或个人专属的大型语言模型。

赛题链接：https://cloud.baidu.com/qianfandev/topic/268516

看到这个题目我还挺兴趣的，抽空想了想解题思路和步骤。分享出来，欢迎大家一起交流～

接下来我们先对赛题进行简要描述，再进行解题思路详解，最后完成专属的大型语言模型创建。

赛题内容

生成一个可制作贺岁文案内容的精调模型（限定使用ERNIE Speed，通过对模型精调使其保持原有能力的同时，具备准确理解并执行文案创作中创作长度相关指令的能力）。

输入：包含创作长度要求的对文案创作的需求描述文本。（如：如何应对生成给领导的拜年文案；作为“I”人，如何在家庭群中发送讨长辈欢心的50字以内拜年语；如果你作为家长，如何辅助指导孩子完成“300字过年作文”的作业......）
输出：严格符合长度要求且满足其他创作需要的创作内容。

参赛任务:

通过在千帆大模型平台使用平台上的各种模型调优工具，结合相关数据，基于ERNIE-Speed调优生成符合赛题主题要求且效果优秀的模型。
补充说明：官方提供「贺岁文案」基础数据集，开发者需要在此基础上做延伸和扩充（模型训练最少需要100条数据）。
微调后的大模型需可访问在千帆大模型平台平台部署服务EndPoint、所有调优过程数据，超参设置和步骤描述，确保评审过程中必要的复现。
本次赛题必须使用百度智能云千帆大模型平台（千帆Modelbuilder）完成开发。

模型评价说明:
a.文案创作包括但不限于生成、摘要、扩写等常见应用场景及常见风格与修辞等要求。
b.如果创作要求合理，生成内容必须语义语法正确，主题与创作要求相符，否则不得分。
c.如果篇幅要求合理，则在b的基础上，生成内容需要符合指令中篇幅相关的要求，误差不超过5个字，否则扣分。
d.如果篇幅要求不合理或与指令中其他部分存在矛盾，则生成对应提示，而非继续创作，否则扣分。

解题思路

在创建自己的专属场景大型语言模型时，通常需要以下几个步骤：（1）选择合适的底座大模型；（2）数据构造；（3）模型微调；（4）模型评估。

选择合适的底座大模型

选择合适的底座大模型是为了模型可以快速获取较为优异的效果，让我们站在巨人的肩膀上。由于赛题指定了“ERNIE-Speed”底座模型，因此，在此不需要进行额外的选择。

数据构造

数据构造是构建专属大型语言模型的关键环节，涵盖了数据的获取、清洗、标注、预处理。目前指令微调数据构造可以借助大型语言模型进行自动构造，节省人工标注成本，主要采用Self-Instruct方法，如下图所示。Self-Instruct方法中，首先利用一个任务种子集作为任务池的起点，随机采样出多个任务指令，利用大型语言模型生成新的指令内容；再利用大型语言模型判断指令任务是否为分类任务（分类任务与生成任务的要求有所不同）；然后利用大型语言模型对新的指令内容进行补全，主要是生成输出结果，并且判断如果需要额外输入文本也同步生成；其次进行数据过滤，满足要求的数据加入到任务池中，最后重复上面几步操作，直到数据达到数量要求。

由于本赛题已经提供数据集样例，可以将官方提供的数据集作为“种子池”，并且可以利用百度智能云千帆大模型平台中的“ERNIE-Bot 4.0”模型来进行数据构造。种子池数据样例如下：

[{"prompt": "假如你是企业CEO，请以正式鼓励的风格为全公司员工撰写50字的春节祝福语。", "response": [["亲爱的团队成员们，值此新春佳节之际，向你们致以诚挚的祝福和感谢。过去一年，我们共同努力，取得了骄人的成绩。愿新的一年里，家庭幸福、事业成功，我们携手迎接更加辉煌的明天。祝大家春节快乐，万事如意！"]]}]
[{"prompt": "假如你是家庭医生，请提供一段30字内温馨安慰的春节祝福给病人。", "response": [["春节将至，愿您快乐安康，疾病远离，新春暖暖，幸福满满。"]]}]
[{"prompt": "撰写春节期间的工作安排通知，明确工作调整、休假政策和紧急联系方式，回答不低于200字。", "response": [["关于春节期间工作安排的通知\n\n各位同事：\n\n春节将至，为确保节日期间工作顺利进行，特此通知如下：\n\n1. 工作调整：春节期间，公司将按照国家法定节假日安排进行调整，具体时间为xx月xx日至xx月xx日放假调休。期间部分部门将安排值班，请提前与部门负责人确认。\n\n2. 休假政策：员工可享受法定假期，如有特殊情况需请假或调休，请提前向人事部门申请。\n\n3. 紧急联系方式：如遇紧急情况，请及时联系公司值班电话：xxxxxxxxxxx。\n\n请大家合理安排工作与生活，确保度过一个欢乐、祥和的春节。\n\n祝大家春节快乐！\n\n公司管理层\n2023年xx月xx日"]]}]
[{"prompt": "创建春节特色菜单介绍，包括菜品选择、食材来源和烹饪技巧，回答不低于200字。", "response": [["春节特色菜单以团圆和吉祥为主题，精选菜品丰富多样。主打的“年年有余”鱼香肉丝，选用新鲜猪肉和脆嫩的竹笋，切丝均匀，鱼香调味恰到好处，寓意年年富足。另有“金鸡报喜”宫保鸡丁，采用农家土鸡，丁状均匀，口感鲜嫩，辣香四溢，象征吉祥如意。还有“五福临门”五彩蔬菜拼盘，集五种颜色蔬菜于一体，色彩缤纷，营养均衡，代表五福同享。食材均来自当地绿色生态农场，确保新鲜无污染。烹饪时注重火候控制和调味搭配，力求呈现最佳口感，让家人围坐一桌，品尝美味，共享天伦之乐。"]]}]

步骤1：随机采样6个种子池中的数据，并利用“ERNIE-Bot 4.0”模型生成4个新的任务指令。其中生成数据的提示词为“请生成4个任务描述，所有任务必须与春节相关，注意注意注意：仅提供任务描述即可。\n下面有6个任务描述可以参考，但不要类似，要有一定的区别：\n任务1：{}\n任务2：{}\n任务3：{}\n任务4：{}\n任务5：{}\n任务6：{}\n请生成结果：”。