AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


人工智能:大模型从技术到业务应用
发布日期:2025-01-11 22:10:04 浏览次数: 1536 来源:超哥看天


  

大模型在行业内的应用已经从技术探讨研究迈向了业务逐步落地的阶段,从23年更多看到的是大模型的版本升级、能力提升和范围拓展,到24年更多看到行业使用的落地,我们的生活中已经在体验大模型带来的变化。下面从赋能场景、重点行业应用、公共服务应用和数据集重要性几个方面展现大模型行业应用的方向。


1、      大模型赋能应用场景


大模型能够处理和分析业务过程中的庞大数据集,识别复杂管理模式和流程,助力业务决策制定、资源配置、工作协同等,其通过主动、动态、自动和定制能力确保了企业智能化的价值实现。



1.1对业务的三个助推方向

大模型不同场景的技术应用深度可以由使用自动化、数字化和智能化来描述,大模型介入的智能化改造是最前沿、深入的实践。包含破解复杂信息下的人工局限、探索智能代替人工和智能客服的打造三个助推方向。



1.2人工智能的业务应用

大模型的生成式对话能力有了更大的发挥空间,通过赋能用户意图识别、用户对话响应等一系列需要与用户深入交互的情景,提升用户感知和体验。AI技术应用改变了人工处理复杂信息的局面,提升了管理的效率,同时实现了合规性治理。减少“人治”风险漏洞,以“智能替人”完成科学管理决策成为主要探索,以需求预测与管理、优化、自动化与决策支撑等为代表的AI技术应用正不断深化这一进程。

Ø智能对话引擎

通过自然语言处理技术实现对用户意图的深度理解与精准响应,提供更自然、更智能的对话体验,降低人工客服的工作量,提升有效接待量,同时改善客户的服务体验。

Ø个性化推荐

通过深度学习算法分析用户的历史浏览记录、购买行为和搜索习惯,构建精准的用户画像,提供定制化商品推荐,显著提升用户点击率和购买转化率,不断增强用户体验和满意度。

Ø智能寻源

AI大模型通过智能分析和预测技术,提供多维度供应商画像,实现精准匹配和报价,显著提升效率和决策质量。

Ø需求预测与管理

通过深度学习和多模态数据分析技术,准确预测市场需求变化,优化库存水平,自动调整采购计划,从而提升供应链的整体效率和响应速度。

Ø标准化管理

通过智能识别和数据分析技术,实现信息的快速整理与归类,促进信息的无缝对接和共享,从而实现标准化管理。

Ø供应链优化

AI技术可以识别供应链中的瓶颈和低效环节,提出优化建议。通过模拟不同的供应链模型,生成式AI帮助企业找到成本效益最高的解决方案。

Ø智能评标

通过机器学习和算法模型,精准提取标书中的关键信息,自动比对和分析,减少人为错误,提高评审的准确性和效率。

Ø自动化与决策支撑

生成式AI能够自动执行重复性任务,释放人力资源以专注于更复杂的决策。同时,AI提供的实时数据分析支持更快速、更准确的决策制定。


2、       大模型重点行业应用


2.1原料行业

聚焦生产过程管控优化,利用人工智能技术逐步改变传统的资源开发、加工和利用方式。

一是资源勘探与开发智能化人工智能结合地质学、遥感技术等多领域知识,提高矿产资源勘探的精度和效率。例如,加拿大的GoldSpot Discoveries公司使用机器学习算法分析地质数据,成功预测了多个金矿的位置,提高了勘探的成功率。

二是生产流程优化与节能减排。人工智能在工业生产过程中实现精准控制,优化工艺流程,降低能耗和排放。例如,在钢铁行业中,宝钢股份利用人工智能技术实时监控高炉运行状态,通过调整操作参数,提高了冶炼效率和产品质量,减少了能源消耗和环境污染。

三是废弃物管理与资源回收。人工智能通过图像识别、物联网等技术手段,实现废弃物的精准分类与回收。例如,瑞典的Recycleye公司开发了一套基于人工智能的废物分类系统,能够准确识别不同类型的废弃物,并进行分类处理。同时,还可以利用人工智能分析废弃物成分,探索其再生利用途径,促进循环经济发展。

2.2制造行业

重点关注研发与制造流程优化、产品智能化升级等方向,逐步渗透并重塑生产模式。

一是优化智能制造流程。人工智能技术通过与工业软件、工业控制系统等关键工业要素的深度融合,能够结合市场需求、物料储备和设备状态实现工业生产的智能调度,形成生产过程的高效协同机制,支撑工业企业实现生产的智能决策。例如,AnyLogic仿真平台通过强化学习降低重型机械运动,实现制造产线优化,协调对象的数量增加66%,运动次数减少11%

二是提升智能产品与服务价值。汽车、轨道交通、工程机械等装备逐步向智能化产品演进,基于视觉的环境识别成为目前主要探索方向。航空和交通领域成为开展增值服务的重点行业,如国外某航天公司飞行器座舱内的AI驱动系统可以通过评估和通知燃油水平、系统状态、天气状况和其他基本参数来帮助优化实时飞行路径。

三是产品设计与仿真优化。人工智能辅助设计软件能够根据市场需求快速迭代产品设计、大幅提升仿真效率,有利于增强市场竞争力。例如,北汽福田应用AI找到最佳的设计路径,消除原结构太重和产品质量缺陷带来的问题,零部件从最初的4个零件变为1个,重量减轻70%,强度增强18.8%

四是助力环保与可持续发展。人工智能在节能减排、废弃物管理等方面发挥重要作用,通过优化生产流程、提高资源利用效率,减少环境污染。此外,人工智能还能助力绿色产品研发,推动装备制造业向低碳、循环方向发展。

2.3消费行业

聚焦产品创新与智能化营销管理,正逐步改变消费者的购物习惯与体验,推动行业向更加个性化、智能化的方向发展。

一是新产品研发快速响应市场变化。人工智能技术助力消费品企业快速响应市场变化,开发具有创新性和差异化优势的新产品。以智能家居为例,小米生态链中的产品,如智能灯泡、智能门锁等,通过集成人工智能技术实现了语音控制、场景联动等多种功能,提供了更加便捷、舒适的生活体验。

二是精准营销与智能客服。一方面,人工智能通过分析消费者的购买历史、浏览行为等数据,预测消费者偏好、购买趋势,帮助企业定义目标用户并生成专属营销方案,实现精准营销和个性化产品推荐。例如,衔远科技的ProductGPT营销大模型,结合商品特性与热门趋势,可在几分钟内生成富有创意的营销内容,利用率高达80%。另一方面,基于自然语言处理技术提供面向顾客的智能聊天与推荐等服务,替代传统的人工客服24小时不间断地为用户提供咨询解答、订单跟踪等服务,提升服务效率与用户体验。

三是供应链管理智能化。人工智能的应用使消费品供应链变得更加智能与透明,从原材料采购到生产、物流、销售等各环节的信息都可以被追踪,并基于AI分析预测市场需求以制定合理的生产计划。例如,京东物流利用大模型的数智化供应链技术,聚焦从智能规划到智能仓储与运配,再到智能客服与营销的全链路降本增效,实现采购自动化率超过85%,平均现货率超过95%,库存周转天数降至近30天。


3、      公共服务行业大模型应用


加强数字政府建设是建设网络强国、数字中国的基础性和先导性工程,是推进国家治理体系和治理能力现代化的重要举措。在20241月《国务院关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见》中,明确要求探索应用自然语言大模型等技术,提升线上智能客服的意图识别和精准回答能力,优化智能问答、智能搜索、智能导办等服务,更好引导企业和群众高效便利办事。

3.1政务领域三个“一网”

将“政务政策-政务事项-政务数据存储”深度贯穿模型,驱动整体业务流程灵活易用。通过向大模型发出自然语言指令,便可通达深层数据库,串联多来源、复杂异构的数据表,快速获取直观的数据分析结果。

Ø一网通办

针对老百姓“咨询难”、“办事繁”的问题,打造政务智能客服。通过与政务大厅办事员访谈,总结出事项漏斗体系,为智能客服提供更加人性化的对话式服务,弱化政务专业术语,让用户与智能客服的对话贴近人类的交流方式;增强智能客服对政务服务术语的理解能力,提供百姓更容易理解的智能服务,让政务助手实现真正的“智能”。

Ø一网统管

面对政务数据汇聚量大、但数据检索使用难,数据类型分散复杂、但按主题分析难,政府缺少用数工具、快速取数用数难等困境,打造智能搜索引擎。以数字政府指标库、数据资源库、政策法规库等为渠道,汇聚全省各地各部门政务数据,对汇聚的数据构建标签体系,提供智能搜索服务,借助大语言模型技术,实现自然语言查询,方便用户随时随地查询想要的数据。

Ø一网协同

针对政府工作人员写作需求多、写作效率低等场景,基于中国移动多年积累的政务文本数据,对大模型进行精调,结合大模型的文本生成能力,打造公文写作助手,可以为政府工作人员提供政策分析报告、会议发言稿草拟、会议纪要生成等功能,满足公务人员的日常写作需求。

使用信息场内的政务领域专业知识对模型进行课程学习式增强以及对齐泛化,同时协同私域数据作为最终结果反馈用户。通过政务信息场的调度能力,汇聚散落的关联数据,围绕用户咨询实现场内问题全解决;拓宽政务服务边界,实现主动式服务;政务流程不出“场”,实现可信的政务问题响应,保证政务服务安全可控。

3.2政务服务的智能体

政务行业的智能化建设已经经历了从传统应用系统到智能化Al升级的第一阶段,部分场景已经通过基于小模型的Al智能化技术完成了上线可应用,例如智能问答客服、智能IVR(智能语音导航)、智能工单抽取等场景,已经实现了Al助理提效的价值。但是受限于传统小模型的能力,已经应用的场景面临着效果提升上的难题,新的场景例如智能知识采编、智能报告生成等场景面临着小模型无法实现的困境。

1)知识库构建智能体

从政府网站、百科、书籍等渠道收集政策类知识,涵盖住建局、各类办事大厅、医保局等各类民生诉求委办局等官方网站,同时支撑政数局专家基于坐席问答数据整理出问答知识库。为了降低政务坐席梳理问答对的成本,采用大模型知识采编思路,大模型先对原始政策文档给出建议问答对,然后交由坐席质检。通过该方法,高效积累万级别的高质量问答对。

2)文档理解和检索智能体

采集政策文档文件格式多样,包括pdfwordppt,文档要素多样版面复杂,对图标、文字、表格要素的精确解析能力决定最终的问答效果。采用基于大模型的文档版面分析策略,识别出文档中包含核心政策要点的要素和段落,过滤掉和政策无关的URL链接、广告文本。并通过MinHash、文本相似度计算等技术对政策文档进行篇章、段落粒度的去重,最终形成高质量的政策文档知识。

3)问答智能体

政务问答系统的特点是政策频繁更新、信息内容多源异构,如何让大模型学习和理解最新的政策知识,进行精准的回复是政务系统面临的主要问题。采用了两阶段后训练结合知识库增强的方式给大模型注入政策文档信息,减少大模型的幻觉。第一阶段首先利用政策原文对大模型做持续预训练,经过这个环节大模型充分理解了政策信息,在给定政策要点阐释指令时,大模型能够还原出政策文章的对应片段。第二阶段利用政策原文构建的问答语料,并对大模型进行指令微调,使得大模型可以理解市民的问题并输出对应的政策答案的。为了提升大模型的回复质量,对答案进行了多轮的精细化的标注。保证答案正确并且和问题相关,进一步增强答案的结构化和逻辑性。

生成式大语言模型在多轮对话闲聊等场景体现出了较好的意图理解和流畅自然的对话能力,在政务领域构建一个行业大模型,涵盖问答、工单抽取、分类分拨等场景可以显著市民的满意度,减少人工成本。

3.3文创文旅文化的大模型

24年有很奇特的现象,诸多美丽有底蕴的地方在游戏里、抖音里火了起来,泼天的流量直接带入那久久无人问津的地区,大量人流同时涌入,直观上的旅游带来当地经济的增长,更重要的是文化底蕴的共鸣,在时间的长河中需要给我们留下些什么?

Ø文旅行业模型量身打造

深度融合了景区介绍、文化介绍、入园指引、智能讲解、购票咨询,旅游导览,旅游规划等多元场景。精准定位旅游景区、酒店、旅行社等目标客户群,有效降低了企业的人工客服成本,显著提升服务响应速度与质量,增强客户粘性与品牌忠诚度。经济效益显著,不仅优化了运营成本结构,还通过卓越的客户体验驱动口碑传播。其高效智能的服务模式,正引领文旅智能客服领域的新风尚,展现出广阔的发展前景。

Ø文创大模型以展示场景为核心

打造具备历史、文物等知识的模型应用,构建高质量的文本语义表征,具备语义理解、内容生成、文生图、文生视频、多模交互等能力,支持大模型抽取文物材质、纹饰等元素,融合角色特点,生成具备文物特征的服饰、装束和个性化拟人形象,赋能文物科普、游戏开发、文创设计等应用。

Ø文化的模型化延伸

将历史文物转化为具有独特个性和深厚文化底蕴的拟人形象IP,形成具有强大视觉吸引力的文物拟人形象,承载了丰富的历史和文化信息,为传统文化的传播提供了全新的载体。大模型生成的文物拟人形象为素材,创作历史重现、文化解读、创意叙事等文物系列故事,使读者能够生动地感受到文物背后的故事和文化精神,增强文化认同和情感共鸣。结合文物形象和故事内容,设计数字文创产品,打造具有艺术价值和创新性的虚拟偶像、动画、游戏、AR/VR体验等,通过数字化手段,让传统文化在现代社会中焕发新的生命力。

在社会效益方面,大模型应用,提升了公众对历史文化知识的认知和素养,传播了国宝文物形象和故事,将中华文化推向世界,促进了中华文化在全国范围内的传播,提升了中华文化传播的全球认知度和国际影响力。通过创新的传播方式,促进了社会多元化发展,为不同背景和年龄层的群体提供了接触和学习传统文化的机会,加深了公众对中华文化的认同感和自豪感。


4、       数据集成为模型能力提升关键


大模型发展已经进入多模态融合阶段,作为人工智能学习、训练和验证的“燃料”基础,大规模、高质量、多模态数据集对于多模态大模型能力提升愈加重要,以数据为中心的人工智能时代正在加速到来。

大模型的数据工程涵盖训练数据集的数据采集、数据预处理、数据标注、质量评估、数据合成、开放共享等全生命周期,不仅需要保证数据的数量和多样性,更要强调数据的质量和有效性,并通过严格的数据治理和管理,确保数据的安全性和合规性,降低数据使用中的风险。

4.1数据预处理:多模态词元融合和实时处理成为主要发展方向

数据预处理技术正朝向多模态融合、智能化、实时性全面进化的方向发展。

一是多模态词元化序列向量有效融合。随着大模型向多模态方向发展,预处理技术逐渐整合文本、图像、音频、视频等多种类型的数据,探索建立模型识别的多模态统一词元序列空间方法,实现高效、一致、标准的预处理流程,以支撑模型对复杂多源信息的理解和生成能力。比如,OpenAIGPT-4o模型实现了图像、文本和音频等不同多模态的词元向量统一对齐,平均反应时间仅有 320毫秒,与人类的对话反应速度已经不相上下。

二是自动化与智能化程度持续提高。当前数据预处理过程更加依赖自动化工具和算法,未来亟需利用AI技术自我优化预处理步骤,减少人工处理过程干预,提升效率和精确度,比如自动识别数据模式、智能选择预处理策略。

三是实时处理与流式数据处理能力不断增强。面对大规模实时数据流,预处理技术创新侧重于低延迟处理技术,比如流式计算、实时分析和即时反馈机制,确保模型能够及时响应最新数据。

四是利用边缘计算加速处理效率的趋势逐步显现。为了应对大模型数据量的指数级增长,预处理技术更加倾向于利用边缘计算和分布式处理架构,减少数据传输成本,提高处理效率和响应速度。比如使用Apache Spark等分布式计算框架,在集群中并行处理数据,可有效提升数据预处理效率。

4.2数据标注:新一代高水平数据标注提升高质量数据集供给能力

大模型发展需要新一代高水平数据标注。当前,随着深度学习和人工智能模型的复杂度提升,对高质量、精细化标注数据的需求愈发迫切,这不仅要求数据标注技术能够高效处理大规模数据集,还需要具备对多模态数据(如图像、语音、视频及文本)和跨领域数据综合处理的能力,数据标注逐渐向专业化、智能化、多模态方向发展。

一是自动化与智能化标注工具创新成为焦点。当前,基于计算机视觉、自然语言处理等技术的自动标注工具快速涌现,这些工具利用算法初步完成标注,再由人工进行校验和修正,可大幅提高标注效率,降低成本。比如国内数据标注企业海天瑞声已建成一体化智能数据处理服务平台,可实现语音、图像、视频以及文本等全领域数据的自动标注处理。

二是多模态数据标注技术的融合逐渐成为趋势。随着AI应用向更复杂的场景拓展,单模态数据已无法满足需求,跨领域的多模态标注技术,结合图像、声音、文本和视频的多模态联合标注,正在成为数据标注的新趋势。例如,Human Signal开发的Label Studio开源数据标注工具,可支持文本、图像、语音等多模态数据标注,广泛应用于NLPCV、语音识别等领域,显著提高了AI模型训练效率。

三是持续学习与反馈机制引入促进数据标注质量和效率双重提升。通过将标注后的数据反馈给AI模型,不断训练和优化模型性能,形成标注-训练-反馈的闭环,不仅能提升模型精度,还能指导标注策略的动态调整,确保标注工作更加高效和具有针对性。四是跨学科融合深度和广度进一步拓展。随着人工智能技术的不断发展,越来越多的重点行业领域开始应用数据标注技术,不同行业领域的数据标注需求呈现多样化和专业化的特点,需要跨领域的专业知识和技术支持。

4.3质量评估:数据质量评估和模型反馈机制共同推动数据质量不断提升

当前,人工智能数据集质量评估需求体现在完整性、准确性、一致性、时效性和可解释性等多个方面,评估技术发展趋势主要聚焦以下几个关键方向:

一是质量评估与反馈机制深度融合。数据质量评估引入客观的数据质量评估指标和模型反馈机制,使得数据使用者可以评价数据集的实际综合表现,并反馈给数据提供者以改进数据采集和处理流程。20246月,OpenAI 推出了CriticGPT旨在帮助人类评估和检测大型语言模型(LLM)生成的代码输出中的错误,CriticGPT 通过训练生成自然语言反馈,可以评估出代码中的质量问题,并且在检测自然发生的LLM错误时,其生成的评审比人类评审更受欢迎,准确率高达63%

二是多模态数据质量评估框架快速发展。针对图像、语音、文本等多种类型数据,设计发展了综合评估模型,确保跨模态数据的一致性和互补性。通过融合计算机视觉、自然语言处理和语音识别技术,实现多维度数据质量的全面评估。

三是偏差与公平性评估成为数据质量评估重要组成部分。鉴于AI系统易受偏见数据影响,数据质量评估技术致力于检测并量化数据集中存在的偏差,确保训练数据的均衡性和代表性,减少模型输出的不公平性。通过算法审计和统计测试,系统性地识别并纠偏,保障AI应用的公正性。四是动态数据质量监控体系逐步完善。利用实时分析和流处理技术连续评估数据质量,即时反馈数据问题,支持快速响应。这不仅有助于维护数据的时效性和准确性,也确保了AI模型在数据变化时的稳定表现。

4.4数据合成:合成数据有望解决大模型潜在数据瓶颈

当前,大模型的训练数据严重依赖现有的互联网公开数据。有研究预测,到2026年大型语言模型的训练就将耗尽互联网上的可用文本数据,未来需要借助合成数据解决大模型的数据瓶颈。目前,合成数据正迅速向金融、医疗、零售、工业等诸多产业领域拓展应用。根据Gartner预测,到2024年,60%用于AI开发和分析的数据将会是合成数据,到2030年,合成数据将成为AI模型所使用数据要来1120246月,英伟达式发布全新源模Nemotron-4 340B,具体包括基础模型Base、指令模型Instruct和奖励模型Reward共三个模型。其中,指令模型Instruct的训练仅依赖大约2万条人工标注数据,其余用于监督微调和偏好微调的98%上训练数据都是通过Nemotron-4 340B SDG Pipeline专用数据管道合成。当前,合成数据技术创新主要呈现以下几大趋势:

一是合成数据模型走向深度进化。传统的数据合成方法多依赖统计学和机器学习的基本原理,当前数据合成技术聚焦于深度学习算法模型,特别是生成对抗网络(GANs)的广泛应用。GANs通过一对竞争性神经网络—生成器和判别器的博弈过程,实现了前所未有的数据真实度与多样性,诸如StyleGANBigGAN等高级变种网络技术,极大拓宽了数据合成的应用边界。

二是多模态合成能力不断突破。多模态合成技术通过整合不同模态的特征表示,能够同时生成声音、视频、3D模型等多种类型的数据,不仅丰富了合成数据的维度,也促进了多模态理解和生成任务的进步,为复杂场景应用(如自动驾驶、虚拟现实等)提供了重要的技术支持。

三是强化学习与合成数据逐渐融合发展。近期数据合成技术开始与强化学习算法深度融合,用于模拟复杂环境下的交互数据,帮助智能体在安全、成本效益高的虚拟环境中学习策略。这种结合不仅解决了现实世界数据获取难、风险高等问题,还极大地提升了智能体的学习效率与适应能力,尤其是在自动驾驶、机器人导航等领域展现出巨大潜力。

四是隐私保护与合规性技术不断增强。面对日益严格的个人数据保护法规,数据合成技术创新性地提供了隐私保护解决方案—差分隐私、联邦学习与合成数据的结合,使得在不暴露原始敏感信息的前提下,也能生成可用于训练的高质量数据集,这不仅保障了用户隐私,也为金融机构、医疗保健等行业利用AI技术创造了条件。


5、      行业应用总结

一是数据集很重要。本文很大一部分篇幅是数据集的内容,之前叫做有多少智能就有多少人的投入,那么在大模型时代应该是有多少模型能力就有多少数据投入,行业的数据集将是大模型进展的重要高地,需要重点布局。

二是替换人很难,需要的是大模型的协助。铺天盖地的智能会替换人的宣传是有些抓眼球的嫌疑,应该描述为可大幅提升生产力,基于大模型的智能化应用给人类带来另外一种工作、生活的方式。

三是行业级的应用会更加细分,目前流行的表达是L0L1L2等,估计明年会到L10,这个不奇怪,所有使用级别的应用最终会下沉和细化,大模型是对技术人员有更高业务背景要求的,所以我们搞技术的人需要更稳定的下沉,去研究业务,才会有更大的收获。




关注我的微信

带你体会外面世界de别样人生^




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询