我要投稿

一分钟了解通用\行业\场景大模型的区别和联系

发布日期：2024-12-14 16:58:07 浏览次数： 2621 作者：IT技术分享-老张

前言，智算中心核心任务是承载AI大模型的训练及推理等，进而为各行各业提供便捷、高效、领先和普惠的多元化“算力服务”，大模型作为智算时代的核心“产物”被大家广泛关注，从技术迭代和应用角度可细分为三个类型分别为基础大模型、行业大模型以及场景大模型（垂类大模型）。三者之间的区别和联系是什么？非专业领域朋友如何快速记住它们特点呢？今天我们简单聊聊！

一、智算中心从集群建设到应用落地大致流程

现阶段智算中心我们关注最多的就是产品供应和方案设计（因为GPU缺卡、方案规模大），这仅是智算中心业务的开端，整个流程还需要经过集群建设（含调优）->数据准备->模型训练（含微调）->推理压缩->应用落地等五个核心阶段，每一个阶段都是一项复杂且系统的工程，简单介绍这个是给后面内容做个铺垫。

二、3类不同类型大模型的特点分析

通用、行业以及场景大模型是人工智能领域中的三种不同类型的大型模型，它们在设计理念、应用范围、训练数据和功能特点等方面各有侧重；

1、通用大模型：是指具有广泛适用性的预训练模型，它们在大规模数据集上进行预训练，能够捕捉到语言的普遍特征和知识，通常使用互联网上海量的文本数据，包括书籍、文章、网页等，涵盖多种主题和领域，它是行业大模型和场景大模型的基础。

2、行业大模型：是针对特定行业或领域（如医疗、金融、法律等）定制的模型，它们在通用大模型的基础上，使用行业相关的数据进行进一步的训练和优化。除了通用数据外，还会包含大量的行业专业文献、报告、案例等，其专注于特定行业，能够理解和生成行业特有的专业知识和术语，相比通用大模型更加专业化和精准。

3、场景大模型：是针对特定应用场景（如客服对话、问答系统等）设计的模型，它们在通用大模型或行业大模型的基础上，针对具体场景进行优化。包含特定场景下的交互数据、用户反馈等，往往涉及客户的内部数据，对数据的安全性要求高。

4、三类大模型对“训练数据”的类型、体量、安全性要求等都有差异；

三、怎么“形象”且直观的理解3类大模型呢？

经过和很多客户交流，我认为不同模型特点和大学生培养非常类似；

1、通用大模型好比高中毕业，大家接受到的教育和教材都是通用、公开和类似的，高中毕业后具备的是基本的技能，可以满足日常生活和基础类工作的需要，但对于特定专业领域的工作是无法胜任的；

2、行业大模型好比大学毕业，高中生考上大学后，可根据个人发展，选择不同的专业学习方向，这个阶段的学习内容根据专业不同选修不同的学科，教材也有差异化，修完固定学分在大学毕业前往往还需要进行校内或者校外的实习，检查学习的技能能否更好的胜任工作的需要，在实践中不断发现自身不足并进行持续改进，逻辑就和模型的微调类似（发现不足持续优化）；

3、场景大模型好比岗位培训，用人单位根据毕业生所学专业选择应届毕业生，普遍共识是应届生距离真正独立工作还需要经过系统性的培养，这时公司（正规的大公司或者用人单位）通常会安排导师经过3-6个的一对一带教才能入门，所学的内容通常是公司或单位的内部数据，对安全性要求高。和场景大模型的逻辑很类似，而且还需要在工作过程中持续学习。