AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


中国 AI 算力中心研究报告 2024
发布日期:2024-06-24 08:51:06 浏览次数: 4522 来源:AI云原生智能算力架构



算力产业稳健发展,算力创新能力持续增强,推动我国数字经济量质齐升。


2022 年我国算力规模稳步扩张,算力发展为拉动我国 GDP 增长做出突出贡献,在 2016-2022 年期间,我国算力规模平均每年增长 46%,数字经济增长 14.2%,GDP 增长 8.4%。根据 IDC 数据,2022 年中国智能算力规模达 259.9 每秒百亿亿次浮点运算 (EFLOPS) ,2023 年将达到 414.1 EFLOPS,预计到 2027 年将达到 1117.4 EFLOPS(基于 FP16 计算),2022-2027 年复合增长率达 33.9%。

政策大力催化,战略领衔发展,智算中心发展前景广阔。

国家已出台多项智算中心相关政策。《新型数据中心发展三年行动计划(2021-2023 年)》提出加快高性能、智能计算中心部署,《“十四五”国家信息化规划》强调统筹建设面向区块链和人工智能等的算力和算法中心,《“十四五”数字经济发展规划》提出推动智能计算中心有序发展,打造智能算力、通用算法和开发平台一体化的新型智能基础设施。2023 年 12 月五部门联合印发《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》,政策提出到 2025 年底国家枢纽节点地区各类新增算力占全国新增算力的 60%以上等一系列目标。

人工智能算力基础设施成为我国数字经济高质量发展的重要战略部署,具有重大发展意义。

1)算力普适普惠化是大趋势,相关服务生态逐步构建。“东数西算”工程的实施,带动数据、算力跨域流动,实现产业跃升和区域平衡发展。依托智算中心的超大规模预训练能力,各行业人工智能应用将不必从零开始开发,只需结合领域数据进行调整和增量学习,即可形成具有良好精度和性能的下游应用。

2)截至 2023 年 8 月,根据新京智库统计,目前全国至少有 30 座城市已经建成或正在建设智算中心,同时在企业端已有超过 10 座由大型科技企业主导的智算中心。未来随着 AI 快速发展,预计智算中心数量有望快速增加。

昇腾有望成为国内智算中心建设的最重要力量。

1)从 AI 芯片到算力集群,构建推理+训练国产算力底座。昇腾 910 处理器采用 7nm 工艺,半精度(FP16)算力可达 320TFLOPS,整数精度(INT8)算力可达 640TOPS,功耗为 310W,算力和英伟达 A100 性能基本上相当。华为面向人工智能计算中心等重算力场景,提供 Atlas 900 PoD(型号:9000)等三种产品应用于深度学习模型开发和训练。

2)昇腾已是国内智算中心建设的主导力量:目前,在国内政府为主导的智算中心中,华为昇腾已签约多个智算中心建设,重庆、武汉、西安等城市均已建成人工智能计算中心并投入运营。 同时,由智算中心到城市智能中枢,昇腾全面赋能城市 AI 发展,与城市发展深度结合进一步提升了自身地位。

1 全球算力进入新一轮快速发展期

算力是数字时代的新生产力。万物智能时代对计算的需求呈百千倍递增态势,科学研究、人工智能、数字孪生以及元宇宙等新兴领域的快速崛起,推动全球算力规模的快速增长,驱动算力技术与产品的多元创新,带动产业格局的重构重塑,算力成为全球数字经济发展新引擎和各国战略竞争新焦点。

1.1 数据量增长带来算力需求提升,智能算力规模有望快速增长

数据海量增加,算法模型愈加复杂,应用场景的深入和发展,带来了对算力需求的快速提升。根据白皮书数据显示,从 2012 年开始的 6 年中, Al 计算的需求增加了 30 万倍。

图1:Al 计算的需求上升

算力发展推动我国数字经济量质齐升。2022 年我国算力规模稳步扩张,智能算力保持强劲增长。我国算力产业保持稳健发展,并且为拉动我国 GDP 增长做出突出贡献,在 2016-2022 年期间,我国算力规模平均每年增长 46%,数字经济增长 14.2%,GDP 增长 8.4%。

各地也将算力发展放在重要位置。从算力发展指数来看,我国京津冀、长三角、粤港澳大湾区、成渝双城经济圈等区域算力发展保持领先水平,其中广东、北京、江苏、浙江、山东、上海仍然位于第一梯队。中西部核心省份算力发展日益崛起,贵州、内蒙古、甘肃、宁夏等核心省份算力发展优势突出,随着“东数西存”“东数西训”“东数西算”等链条并行发展,中西部地区技术创新、算力应用、产业基础等制约算力发展的条件不断得到改善。

根据 IDC 测算,国内智能算力规模正在高速增长。2022 年中国智能算力规模达 259.9 每秒百亿亿次浮点运算 (EFLOPS) ,2023 年将达到 414.1 EFLOPS,预计到 2027 年将达到 1117.4 EFLOPS(基于 FP16 计算)。2022-2027 年期间,中国智能算力规模年复合增长率达 33.9%。

图3:中国智能算力规模(EFLOPS)及预测

2022 年中国通用算力规模达 54.5 EFLOP5,预计到 2027 年通用算力规模将达到 117.3 EFLOPS(基于 FP64 计算)。2022-2027 年期间,中国通用算力规模年复合增长率为 16.6%。

图4:中国通用算力规模(EFLOPS)及预测

1.2 AI 服务器是智能算力的基础,行业有望保持高景气度

全球市场:全球人工智能技术发展逐渐成熟,数字化基础设施不断建设完善,推动全球人工智能芯片市场高速增长。IDC 预计,全球人工智能服务器市场将从2022 年的 195 亿美元增长到 2026 年的 347 亿美元,五年年复合增长率达 17.3%。其中,用于运行生成式人工智能的服务器市场规模在整体人工智能服务器市场的占比将从 2023 年的 11.9%增长至 2026 年的 31.7%。

图5:全球人工智能服务器市场规模预测(含生成式人工智能和非生成式人工智能服务器),2022-2026 (百万美元)

国内市场:IDC 预测,未来市场需求量也将会实现大幅度上升,预计 2023 年,中国人工智能服务器市场规模将达 91 亿美元,同比增长 82.5%,2027 年将达到134 亿美元,五年年复合增长率为 21.8%。同时,从工作负载来看,2023 年,大模型的兴起推动了训练服务器的增长速度。

IDC 数据显示,2023 上半年国内训练工作负载的服务器占比达到 49.4%,预计全年的占比将达到 58.7%。随着训练模型的完善与成熟,模型和应用产品逐步进入投产模式,处理推理工作负载的人工智能服务器占比将随之攀升。IDC 预计,到 2027 年,国内用于推理的工作负载将达到 72.6%。

图6:中国人工智能服务器工作负载预测,2022-2027

2 我国开启算力赋能数字经济新篇章

十四五以来,我国充分发挥超大规模市场优势,实现了算力规模和供给水平的大幅提升,行业赋能效益日益显现,发展环境持续优化,助推数字经济蓬勃发展。

2.1 算力规模持续扩大,智能算力成为行业增长的重要基础

从基础设施侧看,数据中心、智能计算中心、超算中心加快部署。随着全国一体化算力网络国家枢纽节点的部署和东数西算工程的推进,我国算力基础设施建设和应用保持快速发展。一是智能计算中心加快布局。

根据 ICPA 智算联盟统计,截至 2022 年 3 月,全国已投运的人工智能计算中心有近 20 个,在建设的人工智能计算中心超 20 个。

地方依托智能计算中心,一方面为企业提供普惠算力,支撑当地科研创新和人才培养,另一方面结合本地产业特色,加快人工智能应用创新,聚合人工智能产业生态,例如武汉人工智能计算中心陆续孵化出紫东.太初、武汉.LuoJia 等大模型,加速推动 AI 在多模态交互、遥感等领域的落地应用。

二是超算商业化进程不断提速。我国超算进入到以应用需求为导向的发展阶段,国内很多超算中心为加强商业化运行改革,引入专业的超算商业化运营公司,以云服务的理念和方式输出超算资源。

图7:紫东.太初大模型是中科院自动化所推出的三模态大模型

2.2 供给水平大幅提升,先进计算创新成果涌现

算力产业加速壮大升级。经过多年发展,我国已形成体系较完整、规模体量庞大、创新活跃的计算产业,在全球产业分工体系中的重要性日益提升。

截至 2022年 11 月,我国计算产业规模约占电子信息制造业的 20%,规模以上企业 2300 余家,创新突破、兼容并蓄的产业发展新格局正加快构建。

一是整机市场不断发展,高性能计算领域,我国超算系统占有量与制造商总装机量均保持全球领先。

二是产业生态不断完善。国产芯片已初具规模,X86、ARM、自主架构 CPU 持续深化规模应用,百度、寒武纪等 AI 芯片加速迭代优化,国产操作系统逐步向金融、电信、医疗等行业应用渗透,鲲鹏生态、PKS 体系等计算产业生态日渐完善,覆盖底层软硬件、整机系统及应用等关键环节。

算力创新能力不断提升。一是基础软硬件持续突破。互联网厂商加速服务器芯片、AI 芯片自研,阿里推出 CPU 芯片倚天 710,已在阿里云数据中心规模化部署;百度智能云联合昆仑芯推出第二代昆仑芯云服务器,搭载的昆仑芯 2 代 AI 芯片整体性能较上一代提升 2-3 倍。

开源操作系统欧拉加强更新迭代,在安全性、易用性、生态能力上进一步提升,2023 年 12 月,在 2023 开源产业生态大会上,华为终端 BG 软件部总裁龚体介绍称,鸿蒙生态设备总量超过 7 亿台,华为自有设备 3 亿多台。

二是新兴计算平台系统加速布局。新型计算系统结构与系统、新型存储系统、领域专用软硬协同计算系统等成为创新热点方向,华为等企业推出多样性计算融合架构,构建包括编程语言、编译器、加速库、开发框架等在内的多样性计算软件栈,降低多样性算力的开发部署难度,提升多样性算力的应用效能。

三是前沿计算技术多点突破。之江实验室等团队联合研发的量子计算模拟器SWQSIM,基于神威超级计算机,可提供每秒 4.4 百亿亿次的持续计算性能。中国科学技术大学等团队研制的九章二号光量子计算机原型机,具备一定编程能力,在图论、量子化学等领域具有应用潜力。

3 全球人工智能计算中心的发展现状

3.1 政策与发展战略:智能算力已成为衡量国力的重要体现

全球范围内的各国都在制定各自的人工智能战略和政策,以推动 AI 产业发展。全球许多国家认识到了 AI 在提高生活质量,推动经济增长,以及维护国家安全中的重要性,因此已经制定了各自的 AI 发展战略和政策。在这些战略中,加强 AI 基础设施的建设被普遍视为关键的组成部分。例如,美国在 2016 年发布的《美国人工智能研究和发展战略计划》中就明确提出了加强 AI 基础设施的建设。同时,欧洲联盟也在 2018 年发布的 AI 战略中明确提出了加强基础设施建设的目标。这些基础设施主要包括计算资源、数据资源、人才资源等。

算力既是数字化的底层基础,也是衡量综合国力的一个重要指标。1)人均智能算力水平的高低成为综合国力发展的重要表现。《2022-2023 全球计算力指数评估报告》数据显示,全球算力排名美国和中国分列前两位,追赶者包括日本、德国等国家。

图8:各国计算力及指数排名(2022 年)

3.2 发展趋势:从智算到超算到量子计算持续推进产业发展,绿色理念贯穿始终

根据相关信息梳理,我们将全球不同地区的智能计算中心的建设特点总结如下:

从智算到超算再到量子计算,持续推进产业发展。人工智能计算中心的发展,面临 AI 算力能耗密度大、成本高、硬件基础设施和软件基础设施等问题,仅仅发展人工智能计算中心不能满足庞大的算力需求,因此还需要发展超算中心、量子计算中心。量子计算领域的研究和开发,将开发量子计算领域的内容,帮助增加该领域的人才储备,带动该领域持续发展。未来人工智能计算中心的建设,将以人工智能理论、技术和应用为支撑,同时兼顾超算中心、量子计算功能,可以配套建设为企业提供普惠算力的公共计算服务平台。

智算中心是构建上层应用、进行数据管理的核心和主体。以智能计算中心为主体,汇聚各行业领域数据资源,推动教育、医疗、能源、公共安全等领域数据的内部整合、共享和开放,支撑人工智能与政府服务、企业服务的融合,提升智能化水平。鼓励相关企事业单位联合人工智能企业围绕应用场景进行人工智能服务,推动数据共享开放。

注重绿色环保,低碳理念始终贯穿发展。从美国、欧盟的智能计算中心来看,正在开发新的技术方案降低数据中心碳排放强度,从而应对计算中心日益增长的能源消耗和温室气体排放所带来的环境污染问题。建设智能计算中心需要考虑能源消耗和温室气体排放问题,提高计算中心的能源效率等,注重计算中心绿色环保,实现碳中和。

互联网、金融、制造业是智能算力需求的主要行业。从行业上看,全球计算力水平前三的行业分别是互联网行业、制造业、金融行业。制造行业算力发展水平历年与金融行业接近,在 2022 年的评估中超过金融行业。从市场数据来看,2022年全球金融行业通用服务器投入规模达 124.7 亿美元,同比增速为 26.3%;制造行业投入规模达 125.8 亿美元,同比增速为 29.0%;从应用场景来看,在全球高度数字化的背景下,制造行业面临着更激烈的全球竞争,市场变化也更迅速,同时二者的主要算力需求有所差异,金融行业更注重数据的快速交互、高频交易,而制造行业通常需要大规模处理实时数据、模拟生产、优化供应链等,对算力的需求更加多样化。

图9:全球行业计算力水平评估(2022 年)

3.3 建设现状:美国、欧盟、英国、新加坡等均高度重视智算中心发展

全球的人工智能计算中心正在以快速的速度发展。这些中心通常是由政府、企业和学术机构共同建立的,并以提供强大的计算资源和专业知识为目标。这些计算中心一般由政府、企业和学术机构共同建立,他们为 AI 的研究和应用提供强大的计算资源和专业知识。

3.3.1 美国在智能计算领域处于国际前列

根据赛智产业研究院,美国智能超算中心布局可基本分为三大体系:美国能源部下属六大国家实验室、美国国家科学基金会支持的依托高校的智能超算中心、美国航空航天局(NASA)下属的 Ames 研究中心超级计算中心。

美国能源部智能计算中心在构思、设计、建造及运维方面全球领先。美国能源部下属的橡树岭国家实验室、劳伦斯·利弗莫尔国家实验室以及 IBM、NVIDIA 公司成立超级计算机卓越实验中心,联合开发新一代 HPC 计算机,使用 IBM 的Power 处理器及 NVIDIA 的 Teslak 加速卡,浮点性能至少 10 亿亿次,最高的可达 30 亿亿次,主要研究核武器、核安全、天文、能源、气候、宇宙、新能源等领域。

多维度机构配合共同发展超级计算行业,并注重绿色环保。

1)美国国家科学基金会通过与美国高校及研究机构合作,为全世界科学家提供免费的、最高性能的超级计算资源,在伊利诺伊大学、加州大学圣地亚哥分校、西纳西大学等高校布局。由美国国家科学基金会资助的美国最大的公共超级计算中心是美国国家超级计算应用中心,业务主机为 Abe。美国德克萨斯高级计算中心主要研究领域为可视化工具、教育、县级计算、数据管理,业务主机为 Stampede。

2)美国航空航天局(NASA)下属的 Ames 研究中心超级计算中心,主要应用于天文、航天、气候、军事等领域,如模拟未来太空任务、预测人类活动对气候模型影响、设计安全高效的太空探索工具和航天器等。

3)美国企业智能计算中心注重绿色环保。2020 年4 月,谷歌宣布致力于让所有数据中心实现 24/7 无碳能源目标,其碳智能计算平台将帮助谷歌根据计算负载来匹配风能和太阳能等清洁能源。

量子计算成为智能计算发展的新重点。

1)政府端:2020 年 7 月,美国白宫科学技术政策办公室和美国国家科学基金会(NSF)宣布投资 7500 万美元在全国建立三个量子计算中心。新的研究所获得 2500 万美元的资金用于量子计算领域的研究和开发,开发量子计算领域的内容,以帮助增加该领域的人才储备,带动该领域发展。三个量子计算中心将分别建立在不同的大学,且每个中心所攻坚的方向不尽相同。

2)企业端:美国互联网企业也在布局量子计算中心。2020 年 8 月,亚马逊宣布全面上市量子计算管理服务平台 Braket,这是一个探索和设计新颖的量子算法开发环境全面管理的亚马逊网络服务(AWS)的产品。客户可以点击 Braket来对在云中运行的模拟量子计算机上的算法进行测试和故障排除,以帮助验证其实现,然后在 D-Wave,IonQ 和 Rigetti 的系统中的量子处理器上运行这些算法。

3.3.2 欧盟聚焦数字主权布局超算和量子计算

政策高度关注,打造智能计算生态环境。2019 年 6 月,欧盟委员会发布了《欧洲高性能计算共同计划(EuroHPC)》,宣布将在欧盟成员国中选定 8 处地点建设“世界级”超级计算机中心,项目总预算高达 8.4 亿欧元,将用于个性化医疗、药物和材料设计、生物工程、天气预报及气候变化等领域,服务对象包括欧洲学术界、工业界和公共部门等各类用户。这一举措标志着欧洲朝着成为全球顶级超级计算区域迈出了重要的一步。“欧洲高性能计算共同计划”致力于联合欧盟各国建设世界级的超级计算基础设施,在超算系统及应用性能等方面打造具有高度竞争力和创新性的高性能计算生态环境。

AI 是欧盟发展智算的重要动力,同时欧盟重视面向未来的量子计算等技术。

1)2020 年 10 月,欧洲云计算平台“GAIA-X”项目正式发布:旨在为欧洲提供“强大、具有竞争力、安全可靠的数据存储基础设施”,以减少整个欧洲对国外云厂商的依赖。GAIA-X 云计算平台将于 2021 年正式上线。2019 年 4 月,欧盟设立一项新的 92 亿欧元资助计划——“数字欧洲计划”,以确保欧洲应对各种数字挑战时有具备所需的技能和基础设施。2020 年 12 月,欧盟拟为“数字欧洲”计划拨付 75 亿欧元,其中 22 亿欧元用于超级计算,21 亿欧元用于人工智能。该计划具体包括:在 2021 年底前至少收购 1 台百万兆级超级计算机;在健康、制造和能源等领域建立可用于人工智能的全欧数据空间及测试设施;部署泛欧量子通信基础架构并支持建立网络安全产品认证计划;专设人工智能、高级计算和网络安全硕士计划等。

2)2020 年 9 月 18 日,欧委会针对欧洲高性能计算联合执行体发布了新章程:拟投资 80 亿欧元支持以百亿亿次计算和量子计算为主的新一代超级计算技术和系统的研究和创新,并培养必备的基础设施使用技能,为欧洲打造世界级的超算生态系统奠定基础,维持并提升欧洲在超算和量子计算领域的领先水平。EuroHPC 主要聚焦 5 大核心领域,分别是基础设施、超算服务的联合、技术、应用,不断拓展的用途与技能。

欧盟的智算发展主要依赖非欧洲的科技巨头。如亚马逊、微软、谷歌、IBM、阿里云、腾讯云等云计算行业巨头。

西门子 MindSphere 工业互联网平台云基础设施服务主要依赖亚马逊 AWS 和微软;雷诺、德意志银行和汉莎航空依赖谷歌云;大众汽车与 AWS 签署了云计算服务协议;法国卫生部选择微软公司来存放其研究数据;阿里云与沃达丰达成战略合作布局德国数据中心,并与西门子合作将MindSphere 工业物联网操作系统将部署在阿里云上,共同发展中国的工业物联网;腾讯云联合 SAP、西门子等软件厂商着手于打造细分领域的解决方案等。绿色环保也是欧盟发展智能计算的重要主题。

2020 年 3 月,欧盟资助的GREENDC 项目正在开发新的技术方案来降低数据中心碳排放强度,以应对全球数据中心日益增长的能源消耗和温室气体排放所带来的严峻挑战。该项目汇集了来自英国、保加利亚和土耳其的 5 个学术、工业联合团体,其宗旨正是有效降低能耗,创建更加绿色环保的数据中心。2021 年 1 月,欧洲范围内的 25 个数据中心服务商与云供应商,以及 17 个协会共同签署一项协议,即到 2030 年使欧洲数据中心在能源消耗上保持中立,实现气候中和目标,这是确保该行业长期可持续发展的重大努力。

3.3.3 英国成立国家计算能力中心和量子计算中心,新加坡建立智能计算中心

英国创建国家计算能力中心。2021 年 3 月,英国科学技术设施委员会(STFC)哈特里中心宣布将联合爱丁堡大学超级计算中心(EPCC)在英国创建一个国家计算能力中心,命名为 EuroCC@UK,成为由欧洲委员会资助的欧洲 30 多个国家能力中心组成的新网络的一部分。STFC 表示,该项目将向公共部门、学术界和工业界开放,支持人工智能研究和创新。

该网络将提供一个分享先进计算的最佳实践和专业知识的平台,高性能计算(HPC)、高性能数据分析(HPDA)和人工智能成为重点技术领域。EuroCC@UK 将展示英国目前的专业知识,并开发培训、软件支持和行业参与项目。中小企业将从这些技术和项目中受益。同时,EuroCC@UK 还将开展理念创新活动,保持英国的科学和工业研究社区参与欧洲高性能计算。

2020 年,英国研究与创新局宣布将在 5 年内提供 9300 万英镑的资金,建设量子计算中心。量子计算中心将在伯明翰、格拉斯哥、牛津和约克的四个大学进行建设,中心将建在牛津南部的哈威尔校区,建筑预算为 3000 万英镑,总共将有 17所大学和 132 家公司参与其中,校园已经具备足够的电力容量和其他基础设施。该量子计算中心将有助于加快相关硬件和软件的开发,以支持英国计算中心产业和更广泛的最终用户群体的发展。

联合德国等国家,新加坡大力发展超算和智算。

1)2016 年新加坡建立国家超级计算中心:提供新加坡最先进的计算、数据和资源设施,支持用户解决科学技术问题,促进行业利用计算机解决问题、试验设计、并优化技术。通过高速宽带网络连接资源,力求在任何地方都能够为所有的用户提供高速的使用体验。

2)2020年 12 月德国英飞凌半导体公司宣布将在未来三年内斥资 2020 万美元在新加坡建立全球首个人工智能中心:这笔投资将用于基础设施建设、人工智能项目、员工培训以及开展合作。根据规划,1000 多名员工将接受人工智能技能培训,目标在2023 年前启动 25 个这一新兴技术的项目。新加坡创新机构、起步公司、高等学府以及研究机构在新的人工智能应用领域可以利用英飞凌的丰富数据为实际问题开发解决方案。英飞凌也与新加坡国立大学系统科学院以及新加坡全国人工智能核心合作,培养新一代的员工和创新者。

4 我国人工智能计算中心的发展现状

4.1 政策与发展战略:政策高度关注,已成为国内科技产业发展重要战略政策大力催化,战略领衔发展。国家已出台多项智算中心相关政策,推动智算中心发展。

其中,《新型数据中心发展三年行动计划(2021-2023 年)》提出加快高性能、智能计算中心部署,《“十四五”国家信息化规划》强调统筹建设面向区块链和人工智能等的算力和算法中心,《“十四五”数字经济发展规划》提出推动智能计算中心有序发展,打造智能算力、通用算法和开发平台一体化的新型智能基础设施。

表1:智能计算相关政策梳理

五部门发文加快构建全国一体化算力网,再次彰显政策支持决心。2023 年 12月,国家发展改革委、国家数据局、中央网信办、工业和信息化部、国家能源局联合印发《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》(以下简称《实施意见》)。

其中,提出重要目标,包括:到 2025 年底,综合算力基础设施体系初步成型。国家枢纽节点地区各类新增算力占全国新增算力的 60%以上,国家枢纽节点算力资源使用率显著超过全国平均水平;1ms 时延城市算力网、5ms 时延区域算力网、20ms 时延跨国家枢纽节点算力网在示范区域内初步实现;算力电力双向协同机制初步形成,国家枢纽节点新建数据中心绿电占比超过 80%;用户使用各类算力的易用性明显提高、成本明显降低,国家枢纽节点间网络传输费用大幅降低;算力网关键核心技术基本实现安全可靠,以网络化、普惠化、绿色化为特征的算力网高质量发展格局逐步形成。政策强调算力建设并且给出明确目标,有助于推动行业进一步发展。

智算中心建设布局浪潮快速掀起,数十个城市正在建设或规划建设智算中心。智算中心能够提供大规模数据处理和高性能智能计算支撑,将经济、社会、产业中各种模型、经验固化下来,形成新的生产力,并支撑智能化的产业、服务和治理。智算中心是具有强公共属性的开放服务平台,能够实现对大区域的数字化辐射带动,成为经济发展的新动力引擎。随着“东数西算”工程、新型基础设施等国家政策规划出台,我国智算中心掀起落地热潮。

当前我国数十个城市正在建设或规划建设智算中心,整体布局以东部地区为主,并逐渐向中西部地区拓展。未来,随着我国智算中心布局的持续优化与完善,以及人工智能应用场景的不断创新和解锁,智能算力需求将得到更大释放,智算中心的赋能作用将被进一步激发。

4.2 发展趋势:应用快速发展催生海量需求,普惠、绿色也将成为重要趋势

4.2.1 AI 应用侧快速发展带来长期、海量的计算需求,智算中心是发展“东数西算”发展的关键

ChatGPT 能够实现当前如此强大的交互,离不开背后庞大的算力支撑。根据绿色节能数据中心官方公众号,ChatGPT 的总算力消耗约为 3640PF-days。按近期在国内落地的某数据中心为参照物,算力 500P 耗资 30.2 亿落成,若要支持ChatGPT 的运行,需要 7—8 个这样数据中心支撑,基础设施投入需以百亿计。

东数西算工程是推进国内算力发展的整体规划。2021 年国家发改委等四部委联合发布了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,明确提出在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等 8 个地启动建设国家算力枢纽节点,实施东数西算工程,构建全国一体化大数据中心体系。

智算中心业务是全国一体化大数据中心建设和东数西算工程的核心关键。用算力主要用于计算复杂度适中的云计算、边缘计算类场景,通常这些场景对实时性有一定要求,不适合完全将本地数据搬到异地计算。

超级计算主要用于科学计算与工程计算等领域,且不同超级计算机的处理器、加速卡、框架等各不相同,商业化服务门槛高。因此,更适合东数西算工程的是智能计算中面向承载后台加工、离线分析、存储备份等大量非实时算力需求业务,而智算中心可以根据不同细分领域业务的算力需求匹配相应的计算能力。在东数西算工程下,智算中心可实现算力统筹和智能调度,能够在全国范围内,根据动态业务需求,在云、网、边之间实现按需分配和灵活调度计算、存储、网络等资源。

4.2.2 算力普适普惠化是大趋势,相关服务生态逐步构建

“东数西算”工程的实施,带动数据、算力跨域流动,实现产业跃升和区域平衡发展。根据未来智库官网,算力服务作为算力输出的关键,以多种场景化云服务为代表,成为全新的交付形式。算力的分布决定了企业能否获得最高性价比的算力,基于分布式云技术,近源交付云资源,在一定程度上降低算力成本的同时,将算力输出进工厂、社区和乡村,以算力服务的方式布局到用户身边,用户按业务需求采购算力、存储、带宽等专业服务,实现无处不在的计算。

依托智算中心的超大规模预训练能力,各行业人工智能应用将不必从零开始开发。根据未来智库官网人工智能模型可以实现在众多场景通用、泛化和规模化复制,只需结合领域数据进行调整和增量学习,即可形成具有良好精度和性能的下游应用,助力各行业智能化升级,实现智能算法应用的普适化。

节能降耗的先进技术成为发展重点。根据未来智库官网,智算中心具有高功率密度属性,随着服务器主流芯片的功耗不断增长,用于 AI 训练的机器单机柜功率密度将大幅增加,传统的风冷模式已无法满足智算中心的制冷散热需求,液冷技术的应用为智算中心绿色化运转提供了解决思路。液冷是指借助高比热容的液体作为热量传输介质满足服务器等 IT 设备散热需求的一种冷却方式,比传统风冷具备更强的冷却能力,其冷却力是空气的 1,000-3,000 倍,热传导能力是空气的 25 倍。同等散热水平时,液冷系统相比传统风冷系统约节电 30%-50%,数据中心 PUE值可降至 1.2 以下,甚至接近于 1。

4.3 建设现状:已有超过 30 个城市建设智算中心,未来前景广阔

4.3.1 政府主导,坚持自主技术路线统筹规划建设

政府是国内智算中心发展的主导力量之一。政府已经投入大量资源来建设这些中心,并且一直坚持自主技术路线。政府在人工智能计算中心的建设上发挥着主导作用。政府不仅在政策上给予支持,也在投资上提供了大量的资金。例如,政府已经在各地设立了一系列的 AI 创新中心和 AI 产业园区,旨在推动 AI 的创新和产业化。

政府也坚持自主技术路线,鼓励国内企业和科研机构进行原创性研究和开发,推动 AI 技术的发展。政府鼓励在关键核心技术上进行攻关,打破国外技术的封锁和限制。政府主导的人工智能计算中心的建设不仅体现在物质资源的投入上,还体现在政策的引导和规划上。政府通过制定长远的发展规划,明确了人工智能发展的方向和重点,这有助于聚焦资源,提高效率。

人工智能算力基础设施成为我国数字经济高质量发展的重要战略部署,具有重大发展意义。截至 2023 年 8 月,根据新京智库统计,目前全国至少有 30 座城市已经建成或正在建设智算中心(不包括企业自主建设的智算中心)。未来随着 AI产业的快速发展,预计智算中心数量还将快速增加。

图10:国内人工智能计算中心分布

4.3.2 企业主体,构建市场化管理运营机制

企业特别是科技巨头也在人工智能计算中心的建设中扮演着重要的角色。多大型的科技公司,如阿里巴巴和腾讯,都在自己的人工智能计算中心投入了大量的资源。中国的企业在人工智能计算中心的建设上也起到了关键作用。一方面,企业可以提供强大的技术支持和市场应用,另一方面,企业在中国的人工智能计算中心的建设中,不仅提供了资金和技术支持,还提供了市场化的管理运营机制。相比于政府和学术机构,企业更注重效率和效益,这有助于提高人工智能计算中心的运营效率和服务质量。

根据 IDC 圈数据,截至 2023 年 4 月,国内已有超过 10 座由大型科技企业主导的智算中心。

表2:企业主导的国内智算中心梳理(在建和已建)

4.4 建设、运营模式:多元化模式并存,政府和科技巨头仍是主导力量

在全国一体化大数据中心协同创新体系构建背景下,地方政府、产业园区、企业等纷纷将智算中心作为培育人工智能产业生态、提升数字经济能力的有力工具。

4.4.1 常见的建设模式:独立投资、第三方出资、SPV 模式

独立投资建设模式:以政府、企业或者科研机构为投资主体,也是当前最主流的形式。

1)政府:对建设项目进行直接投资和管理,建设资金主要来自地方政府财政资金、专项债券发行等,建设完成后智算中心所有权归政府所有。出于促进产业发展、优化产业服务的考虑,不同规模的产业园区日益成为智算中心的投资主体,由园区管委会出资建设智算中心。

2)企业:旨在服务于特定产业发展和特定场景应用。部分负责投资的企业可以同时作为智算中心的建设方,部分负责投资的企业需要联合专业化建设企业进行施工。由于智算中心投入一般较高,往往由大型科技企业承担建设。

3)高校或科研机构:建设一般以智能计算平台为主,服务场景相对单一,建设成本比智算中心小。平台可以向师生、研究人员提供免费的算力支撑,服务于科研教育场景,高校和各类科研机构的科研资源叠加智能算力,为基础研究、前沿科学技术研究提供支持。

由第三方出资的建设模式:智算中心建设的第三方一般为国有控股企业。该模式下,既实现了政府对项目的建设全过程把控和需求的充分对接,还能有效利用相关国有控股公司已有的科技、人力资本、平台资源、市场等优势。智算中心建成后归第三方公司所有,可以由政府承诺用其他项目进行补贴或者置换。具体细分为两类。一种是由地方政府成立新的国有控股公司,专门负责智算中心的建设投资,另一种由地方政府委托或者授权已有的国有控股公司负责出资。

基于特殊项目公司的建设运营(SPV)模式:政府与企业共同出资成立智算中心建设运营项目公司,双方在合作框架协议下按比例出资建设智算中心。政府既可以直接投资参与项目建设,也可以通过国有控股公司、下属事业单位等参与项目建设。项目公司需要由政府授权,按照公司化方式独立运作,负责设计、融资、建造和运营等,向政府、企业提供服务或产品并收取费用。该模式优势在于能够节约政府部门的项目建设成本,实现建设资金筹集,同时启用了专业化建设团队,项目管理方式灵活多样,在项目设计、建设和运营中效率较高。

4.4.2 三类常见运营模式,运营内容逐渐多元化

智算中心出现时间尚短,其运营模式极具探索性,可按照运营方、服务类型、服务内容三方面分析。

运营主体选择:指具体负责智算中心投入建设使用后的运营服务机构。

1)“投-运”一体化模式:即由项目投资方出资成立实体运营公司,负责管理算力服务和生态服务。团队成员一般包括运营公司自身管理职能部门,算力服务营销人员、技术支持工程师等算力建设方人员等组成

2)“投-建”合作模式:即由投资方和承建方共同成立新公司,专职负责算力的运营和对外服务等。该模式下,可以形成投资方和建设方的运营联合,实现运营风险共担,特别是考虑到智算中心后期维护存在一定的技术门槛,在此种方式下,可以保证运营的专业性和高产出。

3)“建-运”一体化模式:具体由承建方成立运营公司,专职负责算力运营和对外服务。考虑到这种模式下由承建方单独承担运营风险,可以由政府给予运营费用补贴,为了约束运营公司经营行为,可由政府对运营公司进行算力利用率等指标的考核。运营收入收益可以由运营方和政府部门共享。

服务类型和内容逐渐多元化。1)服务类型:服务对象包括产业发展、科学研究、公共服务等。2)服务内容:包括提供数据服务、算力服务、算法服务、生态服务等。

图11:智算中心服务类型和内容逐渐多元化

5 人工智能计算中心面临的新形势和新需求

5.1 人工智能计算中心需要适应人工智能“大模型+大数据+大算力”发展的新形势智算中心能够促进人工智能技术在各产业的落地应用,从而带动各个产业的提质增效。农业方面,2022 年《“十四五”全国农业农村信息化发展规划》提出到 2025 年农业生产信息化率达到 27%的目标,智算中心可以提供数字农业专有算法,为农业生产提供强有力的辅助,助力农业生产信息化目标的达成。工业方面,智算中心可以为工业生产的多个场景提供算法和算力支持,提高生产效率。生活服务业方面,智算中心可以为电子商务、智能家居、新零售、智能驾驶等应用场景提供信息技术支撑,带动产业智慧化升级。此外,智算中心也可以为新业态提供基础算力支撑,带动智能网联汽车、元宇宙、数字交易等新业态的发展。

经济效益方面,智算中心将助力人工智能技术带动相关产业规模快速增长。《国务院关于印发新一代人工智能发展规划的通知》提出目标,到 2025 年,人工智能核心产业规模超过 4,000 亿元,带动相关产业规模超过 5 万亿元;到 2030年,人工智能核心产业规模超过 1 万亿元,带动相关产业规模超过 10 万亿元。据IDC 及浪潮信息预测,2020 年至 2030 年我国人工智能核心产业规模的年均复合增长率达 20.9%、带动相关产业规模的年均复合增长率达 25.9%。智算中心可为人工智能技术的落地提供基础算力支持,带动相关产业增长。

图12:2020-2030 人工智能核心产业规模与带动相关产业规模预测

图13:人工智能计算中心项目经济效益

社会效益方面,智算中心可集成各方优势,推动城市数字化转型。智算中心在提供公共算力基础设施支撑的同时,兼具产业“聚合器”和“孵化器”作用,能够有效促进人才、资金、技术、数据等要素的联动,搭建跨行业领域的沟通平台,集成政府、企业、研究院所等多主体的优势促进更多 AI 应用场景落地。此外,智算中心已成为构建智慧城市的基础设施,可帮助打造各种人工智能应用场景,广泛服务于社会治理、智慧安防、移动支付等城市数字化转型的方方面面。

图14:人工智能计算中心项目社会效益

图15:智算中心服务的智慧城市应用领域

目前我国各行业智能化水平较低,需要降低人工智能应用门槛。据中国科学技术信息研究所等发布的《人工智能计算中心发展白皮书 2.0》,目前我国 85%以上的人工智能算力集中在互联网、公安行业,在教育、医疗、养老、环境保护、城市运行、司法服务、交通、能源、制造等领域还没有得到深度应用,对公共服务、生产、分配交换等社会治理、经济活动各环节的智能化水平提升作用仍待提高。未来通用性大模型的开放可以加快行业模型开发速度,实现应用场景的快速复制。各地也可结合自身资源禀赋,基于大模型结合本地优势产业,打造符合当地特色的产业应用。

5.2 人工智能计算中心需要符合国家“双碳”目标的新要求

近年来算力基础设施的能效指标日渐严格。近年来国务院、工信部等多部门陆续出台文件,不断规范数据中心的能耗管理和 PUE 值。据国家信息中心发布的《智能计算中心创新发展指南》,目前对新建大型、超大型数据中心的 PUE 要求已从2017 年的 1.5 降至 2021 年的 1.3 以下,国家枢纽节点平均 PUE 更是要求进一步降到 1.25 以下。“东数西算”工程要求东部地区 PUE 目标不超过 1.25,西部地区不超过 1.2,能效指标更加严格。

图16:国家和地方政策对大型算力基础设施 PUE 值要求演变

智算中心可以通过发展节能技术、算力调度等方式降低能耗,满足低碳发展要求。近年来,得益于数据中心建设的统筹规划及制冷、供电技术的不断改进,智算中心的平均 PUE 值已经有了较大改善。据中国科学技术信息研究所等发布的《人工智能计算中心发展白皮书 2.0》,2013 年以前,全国对外服务型数据中心平均PUE 在 2.5 左右,而到 2019 年底,全国对外服务型数据中心平均 PUE 近 1.6,实现质的飞跃。未来,智算中心建设可以着重发展高制冷效率的液冷技术降低制冷能耗,并通过建设人工智能算力网络实现算力调度,继续提高算力设备使用效率。

6 华为昇腾:国产 AI 算力标杆,国内智算中心建设的核心力量

全栈 AI 软硬产品,覆盖“端边云”。昇腾计算产业凭借着以昇腾 AI 处理器为核心,通过系列硬件和基础软件构建全栈 AI 计算基础设施,为各行各业赋能。昇腾 AI 基础软硬件平台包含华为 Atlas 系列硬件及伙伴自有品牌硬件、异构计算架构 CANN、全场景 AI 框架昇思 MindSpore、昇腾应用使能 MindX、一站式开发平台 ModelArts 和统一工具链 MindStudio 等。在硬件方面,包括模块、标卡、小站、服务器、集群等产品形态;在软件层面,包括异构计算架构、AI 框架、应用使能、全流程开发工具链等产品。

图17:昇腾软硬产品

6.1 硬件:打造以昇腾为核心的 AI 算力底座

基于达芬奇架构的两颗“芯”,其中,昇腾 310 用于推理业务,昇腾 910 用于训练业务。

1)昇腾 310 处理器:本质上是人工智能片上系统,主要应用于边缘计算产品和移动端设备等低功耗的领域。该芯片采用 12nm 制造工艺,最大功耗仅为 8W,半精度(FP16)算力可达 8TFLOPS,整数精度(INT8)算力可达 16TOPS,同时还集成了 16 通道全高清视频解码器。

2)昇腾 910 处理器:该芯片计算密度大,领先全球,相比于同时代的英伟达 Tesla V100 GPU 还要高出一倍,其主要应用于云端,可以为深度学习的训练算法提供强大算力。在算力方面,昇腾 910 表现非常出色,半精度(FP16)算力可达 320TFLOPS,整数精度(INT8)算力可达640TOPS,功耗只有 310W,同时采用了 7nm 先进工艺进程,支持 128 通道全高清视频解码。从算力上看,昇腾 910 和英伟达 A100 性能基本上相当。

图18:昇腾 310 关键特性

图19:昇腾 910 关键特性

表3:主流芯片特性对比

华为昇腾超强算力推理+训练标卡。训练及推理标卡融合通用处理器、AI Core、编解码于一体,需要安装到服务器上,通过服务器提供运算和模型,为数据中心提供强劲算力。

1)推理卡:包括 Atlas 300V 视频解析卡、Atlas 300V Pro 视频解析卡、Atlas 300I Pro 推理卡、Atlas 300I Duo 推理卡。其中,Atlas 300I Duo 推理卡在配置下可以输出整数精度(INT8)达到 280TOPS,半精度(FP16)算力达到 140TOPS。

2)训练卡:主要以 Atlas 300T Pro 训练卡(型号:9000)、Atlas 300T A2 训练卡为主,可广泛应用于智慧城市、智慧交通、智慧园区、智慧金融等诸多 AI 行业场景。

表4:各类标卡特性

行业性能领先的服务器。昇腾 AI 服务器具有超强算力,适用于中心侧 AI 推理以及深度学习模型开发和训练场景。

1)Atlas 800 推理服务器(型号:3000):具有高算力和高能效特点。最大可支持 8 个 Atlas 300I/V Pro,提供强大的实时推理能力,广泛应用于中心侧 AI 推理场景。

2)Atlas 800 推理服务器(型号:3010):具有灵活配置,适配多项负载特点。最大可支持 7 个 Atlas 300I/V Pro,广泛应用于中心侧 AI 推理场景。

3)Atlas 800 训练服务器(型号:9000):有高算力密度等特点。拥有 4 颗鲲鹏 920 芯片,广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。

4)Atlas 800 训练服务器(型号:9010):具有高算力密度等特点。可提供2.24PFLOPS FP16 算力,广泛应用于深度学习模型开发和训练。

5)Atals 800T A2 训练服务器:具有高速带宽等特点。双向互联带宽达 392GB/s,广泛应用于深度学习模型开发和训练。6)Atlas 500 Pro 智能边缘服务器:具有易于部署维护和支持云边协同等特点。最大支持 3 张 Atlas 300I/V Pro 推理卡,单卡功耗仅72W,发挥鲲鹏架构多核、低功耗优势,在边缘场景中广泛部署。

表5:各类服务器特性

性能领先的训练集群。华为昇腾面向人工智能计算中心等重算力场景,构筑性能领先的训练集群,目前主要包含 Atlas 900 PoD(型号:9000)、Atlas 900 A2 PoD、Atlas 900 AI 集群三种产品,广泛应用于深度学习模型开发和训练。

1)Atlas 900 PoD(型号:9000):可提供 20.4PFLOPS FP16 算力,能效比最高可达 20.4 PFLOOPS/46 kW,搭载 32 颗超强算力的鲲鹏 920 处理器,全节点 100G 网络互联,可实现高效加速应用。

2)Atlas 900 A2 PoD:提供 25.6/24PFLOPS FP16算力,最大可拓展至 3.2EFLOPS,全节点 200G 网络互联,能效比可达 25.6 PFLOPS/47.5kW,具有极致算力密度、极高 A 级能效、极简交付部署等特点。

3)Atlas 900 AI:其总算力达到 256P~1024P FLOPS FP16,相当于 50 万台高性能 PC 的计算能力,让人类更高效地探索宇宙奥秘、预测天气、勘探石油,加速自动驾驶的商用进程。

推出昇腾 AI 一体机。昇腾 AI 一体机是国内 AI 软硬件技术的黄金交点,是以国产算力领军者华为昇腾 AI 基础软硬件平台为基础,联合国内领先 AI 厂商打造的先进生产力工具。国内各厂商陆续发布合作款昇腾一体机,应用范围由科研逐步扩展到 AI 全场景乃至垂类模型落地。

2023 年 3 月,华为昇腾与旗下华鹏振宇打造了专为高校和科研院所设计的 AI 训练开发一体机,奠定了将 AI 算力、AI 平台软件、AI 开发框架、开发组件和存储高效融合的算力底座基础架构。

2023 年 6 月,软通动力发布训推一体化平台,支持用户一站式 AI 开发、深度适配不同 AI 应用场景。

2023 年 8 月起云从科技、科大讯飞、智谱 AI 等国内领先 AI 大模型厂商合作款昇腾一体机面世,昇腾一体机应用范围扩展到 AI 全场景;后续医渡科技、安恒信息等公司将昇腾一体机用于自身垂类模型落地。

昇腾一体机凭借其领先的软硬件基础设施性能,以及昇腾的优秀工程化能力,正逐渐成为千行百业大模型产业化重要抓手。

表6:国内重点昇腾一体机发布时间轴

6.2 软件:构建完整的底层架构

6.2.1 CANN:类似 CUDA 的计算架构

CANN 是一种异构计算架构,功能类似英伟达 CUDA。CANN 位于计算资源层和应用层之间,即芯片使能层,实现了在高性能计算硬件和 AI 应用之间架起一座桥梁。部署在昇腾服务器,包含统一的编程语言、统一网络构图接口、高性能计算引擎以及算子库。通过 AscendCL 对外提供 Device 管理、Context 管理、Stream管理、内存管理、模型加载与执行、算子加载与执行、媒体数据处理等 API,帮助开发者实现在 CANN 平台上进行深度学习推理计算、图像预处理、单算子加速计算。在离线推理场景和训练场景都有应用。

CANN 释放 AI 硬件的极致性能,其高性能算子库和调优引擎,支撑快速部署神经网络。深度学习框架构建的模型是由一个个计算单元组成,这些计算单元被称为算子,对应着特定的计算逻辑,构成了加速神经网络的基础和核心。CANN 支持超过 1400 个高性能算子,并提供 900 多种优选模型,并且覆盖了 80%的 DSL算子,其 DSL 算子相比业界其他的产品,提升了 70%开发效率。

正是这些丰富的算子,筑起了澎湃的算力源泉。此外,CANN 还提供了新一代智能调优工具 AOE,取代了繁琐的手动优化操作,降低了调优的门槛,并提高了调优的效率。以ResNet50 网络为例,使用 AOE 进行调优的效率比上一代工具提升了一倍以上,并且性能提升超过 100%。在 CANN 6.0 版本下,模型迁移成功率可达 90%。

图20:CANN AI 异构计算架构

CANN 在各领域深受认可。

1)在学术领域方面:2022 年 3 月,基于 CANN的 AI 论文 PLGAN 强势上榜 2022 CVPR,5 月荣获“软件行业示范案例”,12月,在第八届中国国际“互联网+”大学生创新创业大赛中,“基于昇腾算力及 CANN的创新应用”突破“互联网+”国赛金奖。

2)在科研领域方面:分子动力学模拟服务在 CANN 的助力下成功商用,AI 预测性能达到现有产品的 1.5+倍,可预测规模较传统方法提升 10000+倍,为光伏材料、新能源电池、半导体材料研究带来巨大的商业应用价值。此外,昇腾 AI 平台端到端使能蛋白质结构预测基于 CANN进行多维度性能优化,使得 AI 预测效率较 Baseline 提升 2+倍,同时具备长序列推理能力,2022 年底已支持 3800+长度的蛋白质氨基酸序列,达到业界领先水平。

6.2.2 MindSpore:全场景 AI 深度学习框架

MindSpore 是华为推出的支持云边端灵活部署的深度学习框架。人工智能领域的发展,离不开深度学习框架。从 2012 年以前的 Torch、OpenNN 等原始深度学习框架的发布,到后面形成了 TensorFlow 和 PyTorch 双头垄断,再到现在中国国产框架有了一席之地,深度学习框架市场新品更新不断。2020 年,华为研制的 MindSpore 正式开源,和 TensorFlow、PyTorch、飞桨等框架共同为人工智能领域发力。

图21:昇思 MindSpore 总体架构

MindSpore 帮助开发者孵化出各种 AI 创新算法和应用。在 2018 年“华为全联接大会“上提出了人工智能面临的十大挑战,其中提到长部署周期,高开发成本、高技术门槛等问题,为了应对这些问题,昇腾 MindSpore 专注于实现开发友好、运行高效、全场景按需协同三大目标,以有效降低开发门槛。

一般而言,开发深度学习软件框架能够把程序员从繁琐细致的具体编程工作中解放出来,从而将主要精力集中在人工智能算法的调优和改进上。昇思 MindSpore 作为新一代全场景 AI 框架,亦是如此,同时具有图算融合、分布式并行、企业安全可信等功能,能够实现模型的训练-推理-全场景部署。

图22:支持全场景统一推理,大幅提高部署效率和推理性能


MindSpore 在全球 AI 框架使用率方面处于第一梯队。根据 Omdia 的调研数据,在社区活跃度方面,MindSpore 以 11%的占比,排名第四;在中国开发者心中,MindSpore 在国产框架中认知度排第一,全球框架中认知度排第三。在人工智能框架使用率方面,TensorFlow、PyTorch、昇思 MindSpore 和飞桨合计占了 86%的市场份额,其中,MindSpore 以 11%的占比在全球框架里排名第三,逆势进入了 AI 框架的第一梯队。

图23:中国开发者主流人工智能框架使用率排名

6.2.3 MindStudio:面向开发者的全流程开发工具链

MindStudio 提供全流程开发的工具链。开发者可以利用 MindStudio 提供的简单易用的开发工具,高效地完成端到端开发,让开发者能够在安装部署、模型训练、模型推理、算子开发、应用开发、调试调优和应用部署全流程中一站式完成,无需切换不同的工具,从而显著降低了开发门槛。MindStudio 支持训练、推理场景。

1)训练场景:MindStudio(昇腾训练加速工具)利用独有的算法,使训练速度提升 25%。

2)推理场景:MindStudio(昇腾模型压缩工具)利用独有的智能算法,加速推理进程,可大致提速 47%。

图24:MindStudio 开发流程

6.3 生态:打造国内领先的生态伙伴体系,为千行百业注入新动力

华为坚持“硬件开放、软件开源、使能伙伴、发展人才”生态战略,截至 2023年 7 月 6 日,昇腾 AI 开发者已经超过 180 万,合作伙伴超过 1200 家,行业 AI解决方案认证超过 2500 多个。昇腾生态伙伴包含整机硬件伙伴、IHV 硬件伙伴、应用软件伙伴、一体机解决方案伙伴以及生态运营伙伴五大类。其中,整机硬件伙伴有 13 家、IHV 硬件伙伴有 6 家、软件伙伴大约 1200 家,以萨技术是其一体机解决方案伙伴,极视角科技以及中软国际是其生态运营伙伴。

1)整机硬件伙伴:在昇腾计算整机硬件的产品方面,华为通过包括宝德、华鲲振宇、神州数码等众多主流的厂商合作,内容主要涵盖服务器,共同打造适应产业发展的产品。

图25:整机硬件伙伴

以黄河信产为例,黄河信产专注于鲲鹏系列通用计算和昇腾系列 AI 计算的服务器、微型计算机以及软硬一体化解决方案,并与生态伙伴紧密合作,共同推动计算生态的创新。其产品包括 Huanghe OceanAI 900H 训练服务器、Huanghe OceanAI 800H 推理服务器、Huanghe OceanAI 500 Pro 智能边缘服务器等。

表7:黄河信产相关产品参数

2)IHV 硬件伙伴:凌华科技、研扬科技、研华科技、飞途、东声智能、全爱科技 6 大公司成为 IHV 硬件伙伴。该合作伙伴基于华为昇腾部件进行二次开发,形成自有品牌硬件产品并进行销售。

表8:IHV 硬件伙伴相关产品参数

图26:IHV 硬件伙伴

3)应用软件伙伴:对接昇腾服务器、智能小站、集群、加速模块和卡以及MindSpore等产品,华为昇腾应用软件伙伴开发、销售自有知识产权的应用程序、软件、垂直细分应用等产品。该合作伙伴属于数字政府和制造行业的居多。

图27:应用软件伙伴

4)一体机解决方案伙伴:以萨技术成为华为昇腾唯一的一体机解决方案伙伴,基于昇腾系列的产品,打造了以萨智慧交通和以萨智慧交通两大解决方案。

5)生态运营伙伴:华为昇腾和极视角科技以及中软国际达成合作。其中,极视角通过昇腾产品构建了“智慧城市”解决方案,具有部署方便、一键式安装、一站式管理和数据不外泄功能;而中软国际年蝉联中国软件和信息服务综合竞争力百强企业前 15 位,致力于昇腾算力企业合作、方案构建、算力运营等领域。

6)开发者生态:华为将构建开发者生态视为最重要的工作之一,从五个方面围绕开发者生态进行展开。

多生态、多领域能力全面开放:利用华为技术底座和开放能力,华为开发者官网集结了各种生态和领域的开发平台和工具套件,全面开放华为在人工智能、数据库、物联网、云原生、HarmonyOS、HMS、鲲鹏、昇腾等领域的技术能力。旗舰赛事汇聚,赋能应用创新:精选华为各生态领域的顶级赛事,向开发者全面开放华为在各产业领域取得的技术成果,鼓励开发者探索前沿技术。

线上线下活动,链接生态商机:根据企业、高校、个人等不同开发者群体的需求,华为提供丰富的线上活动、线下沙龙、技能培训和产品体验等活动。凭借华为专业的产品能力和大量的学习资源,全方位赋能开发者在云上开展实际项目,帮助企业开发者链接生态商机,共同推动产业生态的发展。丰富的项目促进开发者成长:为拥有覆盖多个领域、多个生态圈的 30+开发者计划,联结全球各地的开发者。

针对企业、个人和高校,华为提供全方位的支持,包括在开发、推广和变现等环节给予帮助,助力全球开发者成长,加速开发者生态的成熟发展。打造一站式开发者服务:围绕开放能力、学习赋能、应用构建、商业变现、服务支持等一站式的开发者服务,全新升级的开发者官网覆盖了产品、活动、program、社区、学堂和支持菜单,便于开发者从自身兴趣和目标出发,快速检索获取相关产品服务。

图28:昇腾相关的开发者计划

昇腾万里伙伴计划是基于昇腾 AI 基础软硬件平台推出的一项计划,提供培训、技术、营销和市场的全面支持。从伙伴、开发者、高校、初创企业等方面,开展相应计划,进行全面激励。

1)伙伴合作计划:根据伙伴的技术和市场能力,以及业绩贡献,将伙伴分为注册级、认证级、领先级、优先级,享有不同权益。

2)开发人员成长计划:根据开发者在昇腾开发者社区的活动,给予不同积分,可获得相应权益。

3)高校教学合作计划:与国内“双一流”建设高校合作,或校内设有 AI 学院或研究院、或设有独立的 AI 相关学科均可以加入 AI 人才培养计划。

4)初创扶持计划:分为孵化、成长和云腾三个阶段,企业参加该计划后,获得相应的扶持,随着与 Atlas AI 计算解决方案的进一步深入融合和裁员,进入成长和云腾阶段,获得更高额度的扶持,并且会优先向伙伴和客户推荐销售。

图29:昇腾万里伙伴计划

华为基于硬软件产品,推出众多 AI 解决方案。在人工智能计算中心、能源、金融、交通、电信、智慧城市、制造和医疗等行业广泛应用,并且创造了行业高价值。

AI 计算中心赋能产业集群。AI 计算中心提供从底层芯片算力释放到顶层应用使能的人工智能全栈能力,重点是构建"一中心四平台",实现政府、产业、学术研究和应用场景的全方位连接和合作。通过这种方式,推动人工智能产业在区域乃至全国范围内的集聚和发展,促进"政产学研用"五位一体的协同发展。

图30:AI 计算中心的“四平台”发展模式

6.4 核心地位:昇腾是国内智算中心建设的核心力量

昇腾具有全方位的 AI 智算中心解决方案,对 AI 智算中心的需求方具有高度的友好性。昇腾打造的 AI 计算中心解决方案根据不同行业及客户需求,提供包括全栈 AI 计算中心解决方案、云 AI 计算中心解决方案、轻量化 AI 计算中心解决方案在内的三种不同规模的解决方案。

1)全栈 AI 计算中心解决方案:面向有全栈搭建需求的智能计算中心,提供多样化算力,LO-L3 全栈交付。以应用驱动的多样性算力融合、超高密硬件架构创新、应用感知的存算协同全栈能效管理,获取倍数级全栈优势。

2)云 Al 计算中心解决方案:面向需要搭建硬、软件平台的智能计算中心,提供 Atlas 硬件和华为云 HCSO(ModelArts)软件,为客户提供高效、可知识复用的一站式 AI 模型开发平台在数据处理阶段可节省 50%~80%的人力、智能标注可使得标注效率提升 70%,基于图像分类的 AI 训练性能可达到业界的 4.5 倍、推理性能可达到业界的 1.8 倍。

3)轻量化 AI 计算中心解决方案:面向软件平台需要聚焦行业属性的智能计算中心,提供合作伙伴基于 MindX DL 的具有行业属性的深度学习平台,具有 web页面,一键安装部署,操作简单,5~10 步即可完成训练。

图31:三种不同规模的 AI 计算中心解决方案

应用方面,昇腾 AI 支持众多应用场景。鹏城云脑Ⅱ以 Atlas 900 AI 集群为Ⅱ底座,结合 AI 集群软件,可以实现 AI 算力自由扩展至 E 级的 AI 计算系统,通过多样化的异构计算平台、多源算法平台和多态智能应用,支撑 AI 重大应用的模型训练及推理,可用于自动驾驶、城市大脑、智慧医疗、智慧交通、语音识别、自然语言处理等应用场景。

图32:昇腾计算产业生态

华为昇腾是国内政府主导智算中心建设的核心力量。我国超大规模预训练模型的发展如火如荼,算力需求持续攀升,人工智能计算中心的建设保持快速增长。政府统筹建设的人工智能计算中心,多采用国产通用处理器和 AI 加速器技术,以华为昇腾、寒武纪思元等国内 AI 芯片为主。目前,在国内政府为主导的智算中心中,华为昇腾已签约多个智算中心建设。重庆、武汉、西安等城市均已建成人工智能计算中心并投入运营,多个人工智能计算中心建设也在陆续规划中。

表9:华为部分昇腾智算中心情况梳理

6.5 全面赋能:由智算中心到城市智能中枢,昇腾全面赋能城市 AI 发展

城市智能中枢的解决方案是面向数字政府,致力于加速数字政府的智能化升级,让城市整体运转更聪明、更智慧。将底层 AI 算力所需的基础软硬件、智能调度能力的软件平台层以及各类 AI 软件算法层进行整合,并以此为底座,向政府各委办局提供标准的接口,发布 AI 服务,最终各委办局通过调用服务实现各类城市治理以及智慧服务的应用需求。

城市智能中枢方案有三大亮点:

1)全栈 AI 自主创新:支撑打造可持续具备韧性的智慧城市人工智能生态;

2)平台开放、敏捷创新:开放平台能力实现软硬件解耦,端边云协同架构支撑,全场景智能持续迭代创新;

3)产业生态繁荣:合各类优质行业伙伴优势,共同打造标准化可复制的智慧城市解决方案。

走进智能时代,城市的智慧治理必须克服诸多挑战,给出合理的解决方案:

1)打破信息系统烟囱林立局面,消除数据孤岛现象,要在城区层面形成统一的态势感知、综合治理、应急救援、分析决策能力。

2)解决政务服务流程复杂的难题,除各委办局彼此间系统壁垒,给群众提供一体化服务,提高群众满意度。

3)鼓励国内创新政务 AI 基础软硬件,让国内自主创新技术成为城市智慧的根基

图33:城市智能中枢方案组网架构

城市智能中枢方案应用场景丰富,具有重要价值。以几个典型应用场景为例:

1)城管方面:事件自动上报,准确率>90%,自动取证,人力节省 50%,告警恢复自动结案。

2)水务方面:水尺识别率准确率可达 85%以上;可对屏幕占比 5%的漂浮物进行识别;并且准确率可达 85%以上;支持识别洗拖把、洗衣服、扔垃圾、倒泔水等不文明行为识别,可识别远距离的小目标,可识别游泳、船只入侵、人员入侵等多种场景,算法准确率 80%以上。

3)市监方面:视频智能分析,解决人力不足问题。

表10:城市智能中枢应用场景


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询