AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


大模型公司对标系列之十一:阿里巴巴
发布日期:2024-09-10 07:59:16 浏览次数: 1626


公司档案

1999年,马云和其他17位合伙人在杭州创立了阿里巴巴。2003年淘宝网成立。2013年,阿里巴巴国际站成立,开始向全球市场扩展。2014年,阿里巴巴在纳斯达克交易所上市,并成立数据科学与技术研究院(iDST)。2016年成立人工智能实验室。2017年,成立阿里巴巴达摩院,开展人工智能相关研究。2019年发布首款AI芯片,名为含光800。2020年启动M6项目,2021年快速迭代发布了10万亿参数大模型,成为全球首个10万亿参数多模态大模型。2023年,推出超大规模语言模型“通义千问1.0”,并在随后的几个月内进行升级发布“通义千问2.0”。2024年发布开源模型Qwen2-72B,在知识广度、逻辑推理、多轮对话等方面升级,深入布局大模型,专注于“AI+云计算”发展战略,打造AI时代技术领先的云计算服务。

图1 阿里公司发展历程

表1 阿里公司最近三年关键指标

AI大模型技术、产品与服务

1.技术:积极探索研发多种AI技术架构

分布式计算引擎Maxcompute:阿里云的MaxCompute是一种基于云计算的大数据计算服务,采用分布式计算和存储的架构,可以并行处理大规模数据,提供高性能的计算能力。

移动端轻量级的深度神经网络推理引擎MNN:MNN采用多种技术,如运行时硬件加速、模型压缩和量化、网络剪枝等方法,能够在移动设备和嵌入式设备上执行深度神经网络模型的推理任务。

分布式深度学习框架XDL(X-DeepLearning):采用数据并行和模型并行的混合策略,通过动态调整模型和数据分片,充分利用多GPU和多机器资源,显著提高训练速度,简化模型开发流程,支持多种硬件环境和计算平台。

RISC-V架构:达摩院积极参与RISC-V架构的研究和开发,自主研发全球首款基于RISC-V架构的神经网络处理器芯片“含光800”。

AI视频生成技术MotionShop:Motionshop框架由视频处理流水线和姿态估计与渲染流水线两部分组成,视频处理流水线负责提取并修复背景视频序列,姿态估计与渲染流水线负责生成虚拟形象的视频序列。

2. 产品与服务:AI芯片和硬件,多模态大模型赋能阿里B端和C端应用

AI芯片和硬件:旗下芯片公司平头哥半导体负责AI芯片研发,目前已有镇岳、含光、倚天、羽阵、玄铁系列等多款芯片产品,其中含光为AI芯片,均已在阿里云、淘宝电商等场景投入应用。

AI云基础设施:包括CPU、NPU、GPU、FPGA以及超算集群,以满足不同类型和规模的AI工作负载需求。

M6万亿参数AI大模型:2021年11月,达摩院发布万亿参数的多模态大模型M6,其参数已从万亿跃迁至10万亿。

通义大模型体系:2022年9月,通义大模型体系由统一底座层、通用模型层、行业模型层组成。①统一底座是由统一学习范式和模块化设计理念构成;②通用模型层主要包括通义-M6、通义-AliceMind和CV模型“通义-视觉”三大模型体系。③行业模型层:电商、医疗、娱乐、设计、金融、工业、制造业等行业。

通义千问1.0/2.0&8大行业模型&阿里云百炼:2023年4月发布自研大模型“通义千问1.0”,10月在云栖大会正式发布千亿级参数大模型通义千问2.0。①千亿级参数“通义千问”2.0在语言理解、算术解题和问答等领域的基准测试中成功超越一些业界领先的大语言模型;②8大行业模型则面向不同的垂类场景,分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问;③阿里云百炼是基于通义大模型、行业大模型以及三方大模型的一站式大模型开发平台,提供包括数据管理、模型部署和估值以及提示工程等各领域工具,企业和个人开发者可快速便捷开发AI模型。

“夸克”大模型:2023年11月,千亿级参数的“夸克”大模型在CMMLU权威大模型性能评测中,其整体能力已超过GPT-3.5,在写作、考试等部分场景中的测试结果优于GPT-4。

EAS-LLM大模型推理服务:2023年12月,PAI平台推出的针对指定LLM大模型的推理加速与部署服务,通过BladeLLM推理加速和EAS模型部署,实现一键部署LLM推理、AIGC等热门服务应用。

多模态遥感基础模型SkySense:2024年2月,推出20亿参数多模态遥感基础模型SkySense,实现文本、红外光、可见光、SAR雷达多种模态、多分辨率的时序遥感影像建模。

Qwen2系列开源模型:2024年6月,Qwen2系列开源模型包括5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。在中文英语的基础上,训练数据中增加27种语言相关的高质量数据;Qwen2-72B在自然语言理解、知识、代码以及数学等方面显著超越Llama3-70B等大模型。

超强语音处理模型FunAudioLLM:2024年7月,主要由SenseVoice和CosyVoice两个创新模型组成,SenseVoice专注在高精度的多语言语音识别、情感识别和音频事件检测,支持超过50种语言;CosyVoice擅长自然语音生成,具备多语言、音色和情感控制能力,可实现多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随功能。

AI视频创作平台寻光:2024年7月,阿里达摩院推出一站式AI视频创作平台寻光,集成剧本创作、分镜设计、视频素材编辑等关键步骤,创作者可在平台上完成视频创作的全过程。

3.商业模式:开放智能化底座,下调云产品和大模型价格

钉钉开放智能化底座AIPaaS服务:目前钉钉软件的订阅服务客户已超过10万家,付费DAU达到2300万。钉钉专业版年费9800元基础上,增加10000元即可获得20万次大模型调用额度;在专属钉钉年费基础上,增加20000元即可获得45万次大模型调用额度,平均一次调用只需不到5分钱。

云核心产品全线降价,抓住中小企业客户:2023年阿里云宣布核心产品价格全线下调15%至50%,向开发者提供50款云产品的免费试用,时长最多可达3个月,对存储产品最高降价50%,弹性计算包年价格降价15%-20%,视频云和CDN(内容分发网络)降价最高20%,Web应用防火墙降价最高30%。今年4月,海外市场全线降价,覆盖全球13个地域节点部署的核心云产品、500多个产品规格,平均降幅23%,最高降幅达65%,降价后,阿里云海外市场云产品价格全面低于其他国际主流云厂商。通过低价吸引一些中小企业从使用IaaS产品开始,再逐步交叉销售高利润产品。

大模型大幅降价:今年5月,阿里云下调大模型价格,通义千问的核心模型Qwen-Long,其API接口的输入费用从每千tokens0.02元下调至0.0005元,降价幅度达97%,降价后,用户只需支付1元,就可以购买到200万tokens。Qwen-Long模型的价格仅为GPT-4的1/400。通义千问旗舰款大模型Qwen-Max,API输入价格降至0.04元/千tokens,降幅达67%。

AI市场拓展

阿里国际站AI外贸工具助力超3万家全球中小微企业:阿里国际站进一步加大对海外市场投入,将AI外贸工具对海外中小微企业开放。目前在全球范围内近30%的中小微企业倾向于使用AI工具来辅助外贸业务。

收购欧洲B2B平台,形成双品牌运营的格局:阿里国际站收购欧洲知名B2B数字贸易平台Visable,阿里和Visable保持独立运营、相互协同,阿里国际站以更广泛的供应商类型开拓新市场,Visable则能以体验提升吸引新客户,加速阿里国际站在欧洲的拓展。

拿下新加坡大型支付牌照,向深处拓展服务:阿里国际站获得新加坡金融管理局原则性批准,拿到新加坡大型支付机构牌照,可在当地提供包括开户、本地汇款、跨境汇款、货币兑换等在内的一系列支付服务。

AI大模型组织与运营

达摩院与基础设施委员会:达摩院重组原iDST的资源和能力,将研究范围扩大至机器智能、区块链、量子计算、自动驾驶等领域,并在大数据、智能网联、金融科技以及AI硬件等多个产业方向上进行深度布局;达摩院与基础设施事业部负责AI底层基础设施及芯片研发;集团基础设施委员会:由CEO吴泳铭直接统筹负责,协调全集团底层技术基础设施的规划与建设。

平头哥半导体有限公司:2018年,阿里把此前收购的中天微和达摩院自研芯片业务整合成“平头哥半导体有限公司”,负责AI芯片研发,为云服务器提供自主研发的芯片,推进云端一体化的芯片布局发展。

蚂蚁集团成立AI创新研发与应用部门NextEvo:蚂蚁集团是阿里重要组成部分,蚂蚁集团在数字人、多模态大模型等领域进行技术研发和产品创新,2024年1月,蚂蚁集团宣布在内部成立AI创新研发与应用部门NextEvo,由蚂蚁集团副总裁徐鹏担任负责人,负责蚂蚁AI所有核心技术研发。

AI大模型资本运作

阿里积极投资多家AI初创企业,持续推动AI技术创新和生态建设,已经在人工智能领域形成完整的产业链布局。在芯片领域投资寒武纪、深圳科技等企业,在机器视觉和深度学习领域投资商汤科技、旷视科技等公司,在应用领域投资小艾机器人等公司。今年3月,阿里完成对月之暗面和MiniMax的新一轮投资,目前国内一级市场上估值最高的5家AI大模型初创明星公司(智谱AI、百川智能、零一万物、月之暗面和MiniMax),阿里均有参与投资。

表2 阿里在5家AI大模型初创明星公司投资

AI大模型生态体系

阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,降低AI的应用门槛平台。魔搭社区首批合作机构包括澜舟科技、深势科技、智谱AI、哈工大讯飞联合实验室、中国科学技术大学等,首批开源模型超过300个,聚焦在视觉、语音、自然语言处理、多模态等AI方向。魔搭社区不仅提供易用的模型使用平台,而且模型可兼容多种主流AI框架,支持多种训练与服务部署方式,用户可自主选择。目前“魔搭”小区拥有超过100万活跃用户,提供800多个模型,模型总下载量超1600万次。

为企业和学生提供更普惠、更经济的云计算资源。阿里云宣布了时长最多可达3个月的核心产品免费试用,还为开发者提供1000个云技术免费培训课程和约500场基于真实业务场景的实操实验,让开发者轻松掌握云技术。推出“少年云”项目与联合国教科文组织(UNESCO)人工智能与教育教席合作,为中国偏远地区的学生提供云计算资源。

阿里云与多家企业开展生态合作,共同探索大模型的技术合作。与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程。吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家表示未来将与阿里在大模型相关场景展开技术合作。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询