我要投稿

腾讯研究院：行业大模型的应用现状

发布日期：2024-05-31 06:31:44 浏览次数： 4570 作者：芝士AI吃鱼

本报告基于腾讯研究院的行业大模型调研成果,深入分析了行业大模型在当前人工智能领域的应用和发展。我们将探讨大模型技术的背景、在各行业中的应用进展、实现方式、面临的安全与治理挑战,以及未来的发展趋势。

发展背景

大模型技术的兴起

近年来,随着深度学习技术的快速发展,大规模预训练语言模型(Pre-trained Language Models, PLMs)已经成为自然语言处理(NLP)领域的重要范式。这些模型通过在大量无标注文本数据上进行自监督预训练,能够学习到丰富的语言知识和通用表征,并可以通过微调(Fine-tuning)等方式应用于下游任务,取得了显著的性能提升。以 BERT、GPT、T5 等为代表的通用大模型,展现出了强大的语言理解和生成能力,在问答、对话、摘要、翻译等任务上都取得了优异的表现。特别是 ChatGPT 的发布,更是引发了业界对大模型技术的广泛关注。大模型以其海量参数和强大的学习能力,正在推动人工智能的边界不断扩展,成为实现通用人工智能(AGI)的关键路径之一。

"不可能三角"问题

尽管通用大模型在泛化能力上取得了显著成就,但它们在专业性、泛化性和经济性之间难以平衡,即所谓的"不可能三角"问题:

1.专业性:通用大模型缺乏特定领域知识,难以满足垂直行业的专业需求;2.泛化性:通用大模型需要在多个领域都有良好表现,但这往往以牺牲单个领域的精度为代价;3.经济性:训练和推理超大规模模型需要大量计算资源,成本高昂。

这一问题催生了对行业大模型的需求。相比通用大模型,行业大模型通过在特定领域数据上训练,能够更好地平衡专业性和经济性,为行业用户提供高效、专业的AI解决方案。

行业大模型的必要性

行业特定需求

不同行业面临着不同的业务场景和数据特点,对人工智能技术有着特定的需求。通用大模型虽然具有强大的泛化能力,但往往难以充分利用行业知识,提供有针对性的解决方案。相比之下,行业大模型能够根据特定行业的痛点和需求进行定制化训练,学习行业专业知识和语言习惯,从而提供更加精准、高效的服务。

例如,在金融领域,行业大模型可以通过学习海量金融文本数据,掌握专业术语和金融知识,从而在投资研究、风险管理、客户服务等方面发挥重要作用。在医疗健康领域,行业大模型可以理解医学术语和临床指南,辅助医生进行疾病诊断、用药推荐等任务。在法律领域,行业大模型可以分析案例和法律条文,协助律师进行法律研究和文书起草。

与通用大模型相比,行业大模型在成本效益、专业定制和数据安全方面具有明显优势。针对性训练可以显著降低计算资源需求,提高模型落地的经济性。行业数据的使用也有助于保护数据隐私和安全,规避通用大模型可能带来的数据泄露风险。

"人工智能+"战略

"人工智能+"已成为国家战略,旨在推动人工智能技术与各行各业的深度融合,实现传统产业的智能化升级。行业大模型正是"人工智能+"战略的重要抓手,通过将先进的AI能力与行业场景相结合,为行业数字化转型提供新的路径和动能。

一方面,行业大模型能够显著提升生产效率和服务水平。例如,在制造业中,大模型可以优化产品设计、预测设备故障、改进质量管理等,推动生产过程的自动化和智能化。在零售行业,大模型可以分析消费者行为、个性化推荐商品、优化库存管理等,提升运营效率和用户体验。

另一方面,行业大模型有助于催生新的业务模式和增长点。基于大模型技术,企业可以开发创新的产品和服务,拓展业务边界,培育新的利润增长点。例如,教育机构可以利用大模型开发智能教学助手,提供个性化的学习辅导;金融机构可以利用大模型开发智能投顾和风控产品,开拓高净值客户市场。

行业大模型的特点

模型与应用的结合

与学术界主要关注算法模型本身不同,行业大模型更加重视模型在实际应用中的价值实现。行业大模型不仅仅是一个训练好的模型,还包括了围绕模型开发的各种应用、平台和服务。模型只有与行业应用紧密结合,转化为可落地、可使用的解决方案,才能真正发挥价值。

因此,行业大模型供应商不仅需要具备模型训练和优化的能力,还需要深入理解行业需求,设计面向场景的应用方案,提供配套的开发工具和服务支持。这就要求供应商在人工智能、软件工程、产品设计、业务咨询等多个维度具备综合能力,能够提供从模型到应用的全栈式服务。

通用大模型的延伸

行业大模型并非从零开始训练,而是在通用大模型基础上,针对特定行业进行优化和改进。一般而言,行业大模型供应商会选择成熟、开源的通用大模型(如BERT、GPT等)作为基座,在此基础上,利用行业数据进行二次训练,引入行业知识库,优化模型架构,从而得到行业定制化的模型。

这种"预训练+微调"的范式,可以充分利用通用大模型学习到的语言知识,减少训练资源消耗,加速行业大模型的开发和迭代。同时,通用大模型的持续进步,也为行业大模型带来了不断升级的基础能力,使其在语言理解、知识获取、逻辑推理等方面不断突破。

解决方案的本质

从本质上说,行业大模型并不是单纯的技术产品,而是面向行业的智能化解决方案。企业选择行业大模型,并非为了追逐技术热点,而是希望利用AI技术解决实际业务问题,如提高生产效率,优化业务流程,改善客户体验等。

因此,行业大模型供应商需要深入了解行业痛点,洞察用户需求,设计契合场景的解决方案。这就要求供应商不仅要有技术能力,还要有行业经验和业务理解,能够将技术转化为切实的业务价值。行业大模型的竞争,归根结底是行业解决方案和服务能力的竞争。

应用进展

行业间的不平衡

目前,不同行业在大模型技术的应用上呈现出明显的不平衡。总体而言,数字原生行业由于其数据基础好、业务场景适合,对大模型技术接受度更高,应用也更加广泛深入。而传统行业受限于数据质量、业务复杂度等因素,大模型应用还处于探索阶段。

具体来看,互联网、金融、教育、医疗等数据驱动型行业是大模型应用的先行者和主力军。这些行业数据样本量大、质量高,用户触点多,非常适合大规模机器学习算法的应用。例如,互联网平台利用大模型优化搜索和推荐,提升用户体验;金融机构用大模型进行风控和营销,提高获客效率;在线教育平台基于大模型开发智能助教,推动个性化教学。这些行业的头部企业,基本都开始布局行业大模型,以期占据AI发展的制高点。

相比之下,制造、能源、交通等传统行业大模型应用起步较晚。这些行业往往缺乏规范化的数字化数据积累,业务流程长、场景复杂,对大模型技术的适配和优化难度更大。但随着工业互联网、物联网等新兴技术的发展,传统行业的数字化程度不断提高,结构化数据大量涌现,这也为行业大模型创造了应用土壤。未来,随着技术的进步和产业升级,传统行业有望成为大模型应用的新蓝海。

生产性服务业的快速发展

在各行业中,生产性服务业由于其数据基础好、模式轻、对效率和体验要求高等特点,成为大模型应用的集中突破口。特别是金融、广告等知识密集型行业,由于对数据处理和专业服务的需求旺盛,正在快速采用大模型来升级服务模式和业务流程。

以金融行业为例,大模型正广泛应用于客户服务、风险控制、产品营销等场景:

•在客户服务方面,基于大模型构建智能客服系统,7x24小时响应客户咨询,大幅提升服务效率和质量;利用大模型进行金融知识问答,为用户提供专业、权威的理财指导。•在风险控制方面,利用大模型分析海量交易数据,实时识别异常行为,预警金融欺诈风险;通过大模型处理非结构化信息(如负面新闻),动态评估企业信用风险。•在产品营销方面,利用大模型分析客户画像,实现个性化产品推荐;通过大模型自动生成营销内容,提高获客转化率。

广告行业同样需要AI的加持来驱动数字化增长。广告主越来越依赖程序化购买,要求精准触达目标人群。大模型可以帮助广告平台深入理解用户意图,优化受众筛选,提升广告投放的精准度和转化率。此外,大模型生成的智能创意,可以大幅提升广告内容的生产力,降低制作成本。

相信随着人工智能与产业融合的深入,会有更多生产性服务业企业开始拥抱行业大模型,用智能技术推进业务变革。这既是提升企业核心竞争力的需要,也是顺应行业数字化发展大势的必然选择。

重资产行业的逐步探索

制造业、能源、交通等重资产行业,由于其业务流程长、要素复杂,对大模型的应用尚处于探索阶段。但随着工业数字化转型的深入,这些行业积累了丰富的设备数据、生产数据,也逐渐为大模型应用创造了条件。

制造业是重资产行业智能化的重点领域。制造企业正利用大模型优化产品设计、改进工艺流程、预测设备故障等,提高产品质量和生产效率。例如,车企利用大模型分析海量驾驶数据,改进自动驾驶算法;家电企业利用大模型优化产品设计,缩短研发周期;工业机器人企业利用大模型预测设备故障,实现预防性维护。

能源行业也在积极探索大模型的应用。发电企业利用大模型优化电力调度,提高电网稳定性;油气企业利用大模型分析地质数据,指导油气勘探开采;新能源企业利用大模型预测风电、光伏发电量,优化储能调度。此外,能源行业还利用大模型进行安全风险预警,提高生产作业的安全性。

在交通领域,大模型正赋能运输调度、交通规划、智慧出行等方面。例如,航空公司利用大模型优化机票定价和航线规划;铁路部门利用大模型指导列车调度和运力分配;出行平台利用大模型预测打车需求、优化车辆调度。

虽然重资产行业大模型应用尚处于起步阶段,但随着工业互联网、5G、物联网等新技术的普及,将加速各行业数字化转型,为大模型应用奠定数据基础。同时,大模型技术的不断进步,也将从算法、工程、场景等方面加速产业应用落地。未来,行业大模型有望成为驱动产业智能化的新引擎。

实现方式

提示工程

提示工程(Prompt Engineering)是一种利用自然语言指令引导大模型生成特定输出的技术。通过精心设计的提示词,可以在无需重新训练模型的情况下,引导大模型执行特定任务、输出指定格式的结果。这为企业快速探索大模型应用提供了一种灵活、低成本的途径。

对于大模型基础能力较弱或缺乏训练数据的企业,提示工程是快速验证应用想法、积累应用经验的有效方式。通过设计形如"请根据以下材料,生成一份市场调研报告"的提示,即可利用通用大模型的语言能力,实现专业文档的自动生成。再如,设计"请对以下文本进行情感分析,输出情感极性和置信度"的提示,即可快速搭建情感分析应用。

当然,提示工程也有其局限性。提示词设计得不好,容易产生与需求不符的结果。此外,通过提示词来规范大模型行为,可控性和稳定性较差,在任务复杂或数据隐私要求高的场景,还是需要针对性的模型训练和调优。

检索增强生成

检索增强生成是指在大模型生成过程中,引入外部知识库进行信息检索,增强模型的知识获取和事实守恒能力。具体而言,是将待回答的问题,用于检索外部知识库,将检索结果与问题一起输入给大模型,由模型综合两者信息生成回答。

这种方式可以弥补大模型在vertical domain知识欠缺的问题。通过外挂特定领域的知识库,如金融百科、医学文献等,大模型可以利用更丰富、权威的知识生成回答,减少因知识盲区而产生的错误。同时,由于生成过程依赖于客观检索结果,也提高了模型输出的可解释性和可信度。

检索增强生成在智能客服、专业问答、辅助决策等场景有广泛应用前景。以金融智能客服为例,通过接入产品手册、服务条款等知识库,系统可以根据客户问题,随时检索相关信息,给出标准、准确的答复,减少人工客服的工作量。再如供应链管理中,通过大模型检索货物状态、物流节点等信息,可以更好地优化调度决策,提高物流时效。

增量学习

增量学习是指在预训练大模型基础上,利用新增的行业数据,对模型进行二次训练,使其适应特定任务的需求。相比从头训练行业大模型,增量学习在训练效率、资源消耗上有明显优势,因此成为行业大模型的主流实现范式。

增量学习主要采用两种方式:微调(Fine-tuning)和提示学习(Prompt-tuning)。微调是指利用下游任务的标注数据,对预训练模型的部分或全部参数进行再训练,使其适应新的任务分布。提示学习则是在输入侧添加少量可训练参数(即"提示"),通过调整提示参数使模型适应下游任务,而预训练模型参数保持不变。

对于样本量较大、任务适配难度大的场景,微调是更主流的选择。通过Fine-tune预训练模型,可以充分利用行业数据,克服领域适应问题,显著提升模型在垂直场景的效果。以金融风控为例,在BERT等通用模型基础上,利用企业积累的历史交易数据进行微调,可以使模型更好地理解行业特点,识别欺诈风险。

而对于样本量较少的小样本学习场景,提示学习可以减少昂贵的训练工作,快速实现任务适配。例如在人力资源管理中,可以用少量员工画像数据训练提示,引导大模型输出标准化的员工信息卡片,简化人员管理流程。

需要注意的是,增量学习对行业数据的质量提出了较高要求,需要对数据进行脱敏、清洗、标注等预处理。同时,增量学习生成的行业模型,在通用能力上可能有所下降,在应用时需权衡专业性和通用性的平衡。

知识蒸馏

大模型固然性能卓越,但其巨大的模型尺寸也带来存储和计算效率的挑战,不利于实际部署应用。知识蒸馏是一种利用教师模型(大模型)的知识,训练出尺寸更小、推理更快的学生模型的技术,可以在业务可接受的精度损失内,大幅压缩模型体积。

具体而言,通过教师模型对无标签数据进行软标注,用软标签作为学生模型的训练目标,使学生模型学习到教师模型的泛化能力。由于学生模型只学习教师模型提炼过的知识,而不是机械地模仿其参数,因此可以在更小的参数量下,达到与教师模型接近的性能水平。

以智能助手为例,业务上并不需要数百亿参数的超大模型,而是希望利用几亿参数的小模型,在端侧快速响应请求。通过知识蒸馏,可以训练出参数量只有原来1/10、但性能只损失1~2个点的学生模型,大幅降低部署难度和成本。

此外,知识蒸馏还可用于模型的跨语言迁移。例如,可以用英文等资源语言的教师模型,蒸馏出中文等目标语言的学生模型,降低小语种模型训练难度。这对于Mother Tongue不是英语的国家尤为重要。

联邦学习

大模型的训练高度依赖数据,但受数据孤岛和隐私政策的限制,企业往往难以直接共享原始数据。联邦学习是一种在不泄露原始数据的前提下,实现多方数据"联合训练"的隐私保护机器学习范式,为行业大模型开辟了新路径。

联邦学习的参与方,在本地利用自有数据训练模型,仅共享模型参数或梯度等中间结果,而原始数据不出本地,从而保证数据安全。多方模型聚合形成联邦模型,继承了各方知识,比单个参与方模型的性能更优。

以智慧医疗为例,医疗机构掌握就诊数据,药企掌握药品数据,保险公司掌握理赔数据,三方各自训练模型的效果有限。通过联邦学习,三方可以共享数据价值,协同训练医疗大模型,服务疾病诊疗、药物研发、医保控费等应用,而患者隐私、商业机密不会泄露。

联邦学习是AI与数据治理的融合创新,但其工程实现尚不成熟,还面临训练效率低、异构网络适配难等挑战。未来,联邦学习有望与区块链、MPC等技术结合,进一步提升性能和安全性,成为行业大模型的重要使能技术。

安全与治理

可信可控原则

行业大模型处理海量数据,输出指导业务决策,一旦失控将带来重大风险隐患。因此,必须坚持可信可控原则,选择技术能力过硬、商业模式清晰、服务响应及时的大模型供应商作为合作伙伴。同时,要对供应商的算法模型、训练数据、系统架构等进行严格评估,确保其安全、透明、可审计,避免"黑盒"模型可能带来的失控风险。

数据安全与知识产权保护

训练行业大模型需要企业提供大量业务数据,因此必须高度重视数据安全和隐私保护。要确保模型训练所用数据获取合法合规,经过脱敏处理,避免数据泄露和滥用。同时,要与数据提供方签署严格的数据使用协议,明确数据权属、使用范围、销毁机制等。

此外,行业大模型的训练还可能涉及专利、商标等知识产权,需提前规划知识产权归属和许可机制,避免侵权纠纷。

顶层设计与行业协同

行业大模型事关行业数字化转型和核心竞争力,需要监管部门在政策、标准、基础设施等方面进行顶层设计。比如,制定针对人工智能模型的安全、伦理标准,明确红线;建设行业数据共享交换平台,打破数据孤岛;搭建行业AI开放创新平台,促进模型共享和迭代更新。

同时,行业大模型是一项复杂的系统工程,需要产学研用各方通力协作。例如,高校、科研机构从事基础算法创新,企业负责工程化落地,行业协会推动经验交流,政府加强统筹指导。只有"政产学研用"形成合力,才能加速行业大模型技术突破和规模应用。

价值对齐

大模型通过机器学习掌握了惊人的智能,但其价值观和决策逻辑仍由训练数据和目标函数决定,可能与人类价值产生偏差,甚至被误用于违法犯罪。因此,要对大模型开展有针对性的价值对齐,让其行为符合人类的伦理规范和行业操守。

具体而言,要在算法设计上纳入伦理考量,通过惩罚项约束模型行为;要对训练数据进行治理,剔除低俗、暴力、错误等有害信息;要设置模型使用的边界条件,避免被用于危及公共利益的领域;要建立人机协作闭环,畅通用户反馈渠道,持续调教模型。唯有如此,才能真正实现人工智能造福人类的愿景。

全生命周期的安全保障

从数据采集、模型开发、系统部署到应用监管,行业大模型需要全生命周期的安全保障机制。在数据采集阶段,要做好数据分级分类,敏感数据脱敏上链,确保数据来源可信、去隐私化。在模型训练阶段,要做好训练全流程留痕,确保可审计、可追溯。在系统部署阶段,要做好边界安全防护,抵御外部攻击,避免木马、病毒等威胁。在应用监管阶段,要做好模型行为监测,基于规则阈值及时预警,识别异常行为。

AI沙盒

作为一项新兴技术,大模型的安全和伦理风险尚不完全清晰,需要一个灵活、可控的环境进行测试评估。AI沙盒正是这样一个隔离区,企业可以在沙盒内测试模型性能,评估安全隐患,压力测试极端场景等,帮助完善治理政策。同时沙盒也是一个开放平台,监管部门、第三方测评机构等可以访问沙盒,审查模型运行机制,及时发现和消除风险隐患,实现大模型应用的阳光化运作。

合成数据

一个无法回避的现实是,行业数据往往存在标注成本高、隐私敏感、样本不均衡等问题,成为大模型训练的瓶颈。合成数据技术可以部分解决这一难题。合成数据通过人工构造或算法生成拟真数据,与真实数据一起扩充训练样本,可以提升小样本学习和长尾识别能力。同时,合成数据天然脱敏,可以规避数据隐私泄露风险。

绿色可持续发展

大模型的训练需要消耗大量算力,由此带来的能耗和碳排放不可忽视。随着节能减排、碳中和成为共识,绿色节能成为大模型的必然选择。一方面,要在模型设计上"瘦身",优化模型架构,压缩参数规模,在较小开销下获得较优性能。另一方面,要在工程实现上"提速",优化训练流程,改进并行策略,加速硬件升级,提高算力利用率。

未来,大模型或将与新型光电算力、量子计算等技术结合,在性能功耗比上实现新的突破,为产业智能化升级和可持续发展贡献力量。

未来展望

纵观全局,大模型正成为人工智能发展的新引擎和产业变革的新动能,并与行业数字化转型深度融合,呈现出广阔的发展前景。

"人工智能+"行动

国家将人工智能上升为国家战略,出台一系列政策支持人工智能与实体经济融合。"人工智能+"行动计划的实施,将加速大模型技术在各行各业的应用,推动传统行业的智能化变革。一大批创新性行业应用将加速涌现,人工智能驱动的新业态新模式将加速形成。

多模态大模型

随着图像、视频、音频等非结构化数据的激增,多模态大模型成为业界新的研究热点。通过对文本、图像、语音等多种模态数据的联合建模,多模态大模型能更全面地理解和生成内容,在智能助理、内容创作、医学影像等领域崭露头角。未来,多模态大模型将推动人机交互体验的革新,实现人机共生、虚实共生。

以元宇宙为例,虚拟人是元宇宙场景中不可或缺的角色,而多模态大模型正是赋予虚拟人智慧的关键技术。通过多模态大模型,可以让虚拟人更自然地与人对话、表达情绪,更准确地理解人的意图和行为。可以说,多模态大模型将助推数字世界与物理世界的融合,为人类开启一个智能互动的新时空。

AI Agent

行业大模型天然适合作为AI Agent(人工智能助手),嵌入到各类应用、终端中为人类用户提供智能服务。AI Agent将深度参与业务流程和生产过程,并持续学习优化,成为驱动生产力提升的新要素。

未来,AI Agent或将成为消费终端的标配,打造全新的人机交互范式。用户可随时唤醒AI助手,让其分析个人数据,为自己提供量身定制的生活服务,如健康管理方案、投资理财建议等。AI Agent还可以作为数字分身,在虚拟场景中代表用户执行任务,如参加会议、看展等。可以预见,AI Agent将深度嵌入人类生活的方方面面,成为人类的超级助手和伙伴。

端云协同

海量参数带来的计算开销和响应延时,是阻碍大模型规模化应用的瓶颈。端云协同成为破解这一难题的关键路径。具体而言,可以将大模型切分为多个子模型,轻量级模型部署在端侧,负责实时响应请求;大型模型部署在云端,负责训练更新。端云模型之间通过数据流、控制流实现协同,用"边缘+中心"的架构实现性能与效率的平衡。

以自动驾驶为例,利用端云协同,车端可以部署轻量化的感知、规划模型,对路况做出实时判断和规划;云端部署大型的训练、仿真模型,利用汇聚的车队数据持续优化算法。端侧模型通过不断从云端学习,提升自身能力;云端模型通过端侧数据反哺,扩大知识覆盖面。可以预见,端云协同将成为行业大模型的主流实现路径,让AI无处不在、无时不在。

算法架构创新

尽管当前主流的Transformer架构在多个任务上取得了瞩目成绩,但其高昂的时空开销限制了更大规模的应用。未来,行业大模型的算法架构创新将围绕模型效率、鲁棒性、可解释性等维度展开。

例如,利用神经架构搜索(NAS)自动探索最优模型架构,在精度和效率之间寻求平衡;利用因果推理、强化学习等范式增强模型的稳定性和鲁棒性;通过因果图、概念图等技术增强模型输出的可解释性。算法的迭代突破,将进一步拓展行业大模型的应用边界。

同时,随着量子计算、类脑计算、光子计算等新型计算范式的兴起,行业大模型有望实现在算力水平和能效比上的跨越式发展,为智能时代注入新的想象力。

结论

综上所述,行业大模型正成为人工智能创新发展、行业数字化变革的新引擎。通过大模型与行业知识的深度融合,企业可以开发出更专业、高效、智能的解决方案,重塑生产流程、优化管理决策、升级服务模式,实现降本增效和创新发展。

同时我们也应看到,行业大模型仍面临诸多不确定性和复杂性挑战,需要在技术、数据、伦理、治理等方面协同发力。唯有坚持开放创新,注重安全与价值引领,行业大模型才能真正为产业智能化转型赋能,让人工智能更好服务人类社会发展。

展望未来,行业大模型与多模态、类脑、量子等前沿技术的交叉融合,将引领人工智能走向更广阔的应用空间。随着人机共生、虚实融合的新范式加速形成,"人工智能+"的产业图景即将全面展开。站在变革的风口,企业须准确把握行业大模型发展规律,加速布局实践,在智能化的浪潮中抢占制高点、赢得发展先机。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业