我要投稿

中国移动千亿多模态大模型发布，「九天-九九」风趣畅聊堪比GPT-4o

发布日期：2024-05-25 20:39:49 浏览次数： 3141 作者：新智元

新智元报道

编辑：编辑部

【新智元导读】央企通信巨头再次奏响大模型舞台的超强音！刚刚结束的中国移动人工智能生态大会主旨论坛上，中国移动发布了全自研「九天」千亿多模态基座大模型，一举成为国内最值得信赖、最懂行业的全栈大模型。

在通用大模型的时代浪潮中，中国移动，勇立潮头，不落人后！

5月24日，在第七届数字中国建设峰会中国移动人工智能生态大会「AI赋能，智筑国基」主旨论坛上，中国移动发布了最新自研的「九天」千亿多模态基座大模型。

凭借自主研发与行业积累，「九天」基座大模型堪称「国内最值得信赖、最懂行业」的全栈大模型。

和其他企业不同，央企做大模型，是面向国民经济骨干行业，目的是给国家基建转型赋能，「为产业注智，为国家筑基」。

中国移动，当得起一句「央企人工智能领头羊」。

AI电聊对接会议，遇难题自主寻求人类帮助

GPT-4o发布当天，向所有人展示了强大的AI语音助手能力，将电影「Her」中的Samantha带入现实。

而中国移动现场的直播演示，一点也不输OpenAI。

九天·九九

首先上场的「九天·九九」，是一个定制化的个人助理。

两位童鞋向在场所有人展示了，真正的AI助理，如何让主人们效率倍升。

一边是小天，一边是九九。

小哥向自己的助手「小天」提问：「我有点紧张，怎么办」？

暖心的小天开始为小哥出招，并为他加油打气。

旁边女生的助手「九九」则帮她生成了「3道关于二次函数的初中数学题」，并且在后续的追问下给出了详细的解题步骤，分分钟搞定初中生的指导。

接下来，九九还生成了一张六一儿童节的图片，以「九天蓝」为背景。

最后，九九还完成了一个非常实用的功能：告诉它自己的时间计划，它就可以帮忙安排日程了，比如把后天上午9点的一个会议加入议程。

更厉害的是，小天和九九这两个AI助手，直接在现场互通电话对接起了开会需求，完全没有主人们的事儿了。

九天·善学

另一个在演示中登场的，是「九天·善学」。

作为一个基于知识数据和专家指导的产品，它可以协助我们进行专业的行业分析或产业洞察。

而且，如果我们有一个待完善的工作，也可以驱动模型与专家对话来进行修正。

比如它在撰写方案时遇到了一个网络运维方面的问题，会主动开始询问人类专家。

在两位专家给出建议后，它就可以自动进行相关的更新和修改。

九天·网络

「九天·网络」则向我们展示了复杂系统如何完成全局的智能感知。

演示过程中，杭州亚运会场馆以及周边区域被3D复刻到了孪生数字世界，而且对通信网络的信号覆盖范围进行了可视化的渲染。

基于此，「九天·网络」可以感知网络状态、设备状态以及用户体验。

全局的监测和感知结果也可以用可视化的方式呈现出来，信号的光圈使各处的网络状态清晰可见，在下面的图片中，黄色区域表示信号比较好、红色是信号比较拥堵的地方，甚至可以追踪路上的某一个人，从用户个体的角度出发进行分析。

运维人员在检查设备时可以戴着AR眼镜，视觉监测能力可以协助分析设备情况，并直接将分析结果叠加在运维人员的视觉范围中。

此外，也可以让远程专家参与进来，对设备的检修、维护进行指导。

千亿参数+多专家架构

以上所展现的产品和能力，全部来自中国移动「九天」千亿多模态基座大模型的加持。

而要实现如此复杂且智能的基座大模型，就需要在模型架构和参数规模上不断进行技术突破。

中国移动从2013年起就已经开展人工智能的自主研发，在同一领域深耕十年、持续积累，让「九天」大模型取得了技术领先的地位。

「九天」基座大模型采用纯解码与多专家相结合的架构，创新了模型的学习方式——通过结构化数据建模，进行渐进式学习。

模型的参数量，从曾经的十亿、百亿不断攀升至最新千亿级别。

为适应不同的应用场景，「九天」提供1.5B、3B、7B、13.9B、100+B等不同参数量的模型版本，可灵活部署于各种设备和平台。

不仅如此，中国移动还在酝酿下一步更大的训练计划，将数据集规模从5万亿提升至20万亿token，进一步提升模型能力。

有如此前沿的架构和庞大的参数量，「九天」在国际竞赛中的表现可谓是十分突出：

在语音合成领域，在2024年INTERSPEECH语音合成声码器赛道中获得国际第一名。

视觉评测方面也同样出色，获得2023年CVPR VSS（视觉语义分割）赛道中视觉理解方面的第一名。

对照MME-P榜单，「九天」基座大模型的生成能力相当于全球第9名的水准。

除了竞赛成绩喜人，各类测试中的评测结果也十分优异。

我们熟知的多语言理解MMLU、编码HumanEval、数学GSM8K基准中，「九天」基座大模型都取得了不俗的表现。

还有在中文C-Eval、MBPP、BBH基准上，基座大模型取得了领先的优势。

此外，在11个行业领域，中国移动对基座模型展开了124个细类，多达8万多道大学考试或职业资格考试题的测试，结果如下图所示。

「九天」基座大模型在11个领域均拿下了最高成绩。

这些发布会上的「智能」表现，以及竞赛和测评中令人印象深刻的成果，完全配得上它「最懂行业」的定位。

复杂系统智能化

作为全栈大模型，「九天」让自己的能力面向各种复杂行业需求，提出了「复杂系统智能化」的理念，旨在为产业「注智」。

大模型的「智能」说起来容易，但实现起来却很困难，需要攻克许多的难题和壁垒。

为了实现面向复杂系统智能化，中国移动集团首席科学家冯俊兰等专家，做了大量的工作。

如果说AI是一个大海，现在的智能还仅仅停留在表面。想要走向深水区，除了推理、生成、推理这些通用能力，还需要对复杂系统进行感知、预测、诊断、控制和决策。

大部分复杂系统，都是一个混沌的系统。怎样才能从微观走向宏观，从混沌走向清晰？

这就需要结构化的数据。因为在复杂系统中，会有大量的设备，大量的数据。

此外，还有多信源的数据，让AI可以看我所看，为我所为，听我所听。

怎么去表征好这些信号，和通用的模态数据进行融合，就是复杂系统实现真正AI的关键。

总的来说，复杂系统智能化需要解决两大问题：一是大而不稳，二是多而不合。

为此，中国移动在「九天」基座大模型的研发过程中使用了多种策略和技术，包括多层信息加固、溯源信息场一致性校验、大小模型协同等。

这几种技术的结合使用，将「九天」模型打造成为面向「原子化任务」的智能体。

不仅有当下前沿大模型的理解、生成、推理能力，还以此为基础，进一步延展出感知、预测、诊断、控制、决策等更加「类人」的能力。

从每个行业的微观数据到泛行业模型的宏观生态，从混沌、复杂的问题中提取清晰、简单的解决路径，这就是「复杂系统智能化」想要实现的目标。

打通模态信源

「九天」之所以将自己定位为通用的「全栈」大模型，原因之一是打通了各个模态之间的隔阂，实现复杂的大模型系统在「全模态」之间的智能化推理。

不仅包含语音、语言、视觉这些常见的模态，而且囊括了结构化数据，让模态的设计都更加匹配各行各业中的落地场景。

另一个原因在于，中国移动发挥自己在通信领域的龙头地位，让大模型可以在各种信源和设备上灵活部署。

当前的大模型由于参数过大、设备兼容性低等原因，一般只能在服务器或PC端进行推理，但能够提供云边端全面服务的中国移动表示不服。

「九天」大模型不仅可以部署在常见的移动电子设备和物联网传感设备上，比如智能手机、平板、汽车和穿戴设备，还能应用于各种复杂信源，包括雷达、红外、声波、无线射频等等。

这些复杂信源虽然人类难以感知，但对工业生产、通信、服务领域的一些支柱性行业至关重要。

对多种信源的强大适配能力，让「九天」轻松走入各行各业的场景，快速落地应用。

聚焦骨干行业

国内外市场上大模型层出不穷，为什么只有「九天」敢宣称自己「最懂行业」？

从模型定位、训练数据到AI生态、应用场景，「九天」的研发团队始终没有忘记自己「聚焦行业」的初衷——

让最前沿的AI模型服务于骨干行业的技术革新，服务于国家基础设施的智能转型。

因此，「九天」定位为面向复杂行业系统，要在政府治理、工业生产、民生服务、通信特色这四大领域发挥重要作用，提供基座模型。

从训练开始，「九天」基座模型就与行业紧密相连——不仅集成通信、能源、建筑、交通等八大行业的专业知识，而且行业数据在所有预训练数据中的占比达到10%，超过了所有国内和国际的同行。

另外，对于结构化数据的处理，就着重考虑了营销、出行等行业应用，增强了模型的网络智能化实战经验，较传统手段有10%-15%的提升，解决了大模型无法准确处理结构化数据的难题。

在视觉理解领域，训练数据就包含了7000万路视联网，以及200亿+咪咕图、文、视频等行业特色数据，让模型不仅「看得清」、「看得懂」，而且「看得准」。

在「九天」基座模型的基础上，中国移动已经建立了一整套面向全行业的大模型体系和AI生态，共开发出15款行业大模型。

全面支持自主生态

作为AI行业的「国家队」选手，中国移动站在AI技术的浪潮之巅，用实际行动表明了独立自主研发的决心，显示了央企应有的担当。

在研发「九天」大模型体系的过程中，研发团队同时致力于在算力、芯片、框架、算法等领域实现AI生态的「国产化」。

在芯片层面，「九天」系列大模型解决了一大训练难题——在异构芯片之间转换。

在11个厂家生产的17款不同芯片上，团队完成了适配、迁移、测试和标准拉齐等一系列工作，从而支持模型在异构芯片间平滑转化和继续训练。

为了助推国内AI产业加速发展，中国移动还提出了「万千百」智能基座计划，打造「万卡大算力、千亿大模型、百汇大平台」。

在算力层面，中国移动将建成3个两万卡智算中心和12个区域智算中心。

目前，已经在呼和浩特建成的超大单体智算中心，规模超越了全球范围内所有运营商，成为央企「十大超级工程」之一。

随着AI大规模落地，对推理算力需求激增，中国移动还将全面升级已经部署的1500个边缘计算节点，提升训推算力资源配比达到1:10，即1卡训，10卡推。

年底，全网大模型训练卡达到10万卡+，规模将会超过30 EFLOPS。

其次，中国移动还将升级算网大脑新中枢，并构建数联网的新保障。

「百汇大平台」上，还会汇聚丰富的大小模型、数据集及AI原生应用，集模型体验、下载、调优、部署、应用、测评等多种功能为一体，为创业者和开发者提供「一站式」服务平台。

模型安全可信

「九天」系列大模型之所以「值得信赖」，不仅体现在支持国产化的自主研发，还根植于对模型安全性的高标准、严要求。

为了解决大模型在应用中面临的「遗忘」、「幻觉」等共性痛点，团队在训练中应用了知识升维融合、持续动态学习等关键技术。

此外，模型还配备了完善的数据安全、系统安全等保障机制，真正达到安全、可信、可控。

这种对于安全性的执着追求，最终得到了官方的认可。

「九天」自然语言交互大模型同时通过了「生成式人工智能服务备案」与「境内深度合成服务算法备案」，成为首个央企研发的完成双备案的大模型。

在中国软件测评中心开展的测试中，「九天」大模型也获得了最高等级（A级）的安全性认证。

十年磨剑，跨越式发展

在一系列卓越的成就背后，是整个集团创「世界一流信息服务科技创新公司」和勇担国家科创重任的雄心，以及研发团队十年如一日地努力前进、力争上游的决心。

IEEE Fellow、中国移动集团首席科学家冯俊兰博士是整个AI领域的领头人。

她在2013年9月加入了中国移动研究院，也就是那个时候，这家运营商已经嗅到AI的未来潜力。

十年间，冯俊兰博士带领团队在AI技术研发上一步步筚路蓝缕、稳扎稳打，亲历了公司在AI领域实现「跨越式」发展的全过程。

如今，中国移动成立了「九天」人工智能研究院，引入2名千人专家、超150个AI 专业博士，形成2000人AI核心团队，开展了人工智能基础技术、算法、平台、应用的全栈研发，具备了大模型数据构建、预训练、微调、推理等全链路技术的自主创新能力。

在去年，中国移动相继发布了「九天·客服」、「九天·海算政务」、「九天·网络」等垂直行业大模型，以及面向骨干行业开放共建的「九天·众擎基座大模型」，在大模型赛场上发出了响亮的央企声音。

除了发布的产品和模型，中国移动还取得了丰硕的科研成果——原创性提出了体系化人工智能（Holistic AI）技术，受到产学研各界的广泛认可和支持。

荣获中国通信学会科技进步奖一等奖，申请超过930项专利，发表160余篇顶会顶刊论文，并在约20个大型国际竞赛中取得TOP 5的成绩。

展望未来，正如这次大会的主题「AI赋能，智筑国基」，中国移动将肩负AI「国家队」的使命继续前行，把AI领域最前沿的进展带入千家万户、千行百业

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

爆肝50小时，DeepSeek使用技巧，你收藏这一篇就够了！

2025-02-01

Ollama 本地运行大模型(LLM)完全指南

2024-07-25

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

2025-01-01

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

更改ollama模型存储路径

2024-04-25

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

大家都在问

国内首个云电脑 MCP！人人都能搞个 Manus？

2025-04-25

为什么一定要做Agent智能体？

2025-04-25

HR AI小科普——什么是MCP？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

为什么全参数微调能让大模型从“通才”变“专才”？

2025-04-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部