微信扫码
与创始人交个朋友
我要投稿
自从ChatGPT横空出世后,国内的AI大模型们就开始了百花齐放、百家争鸣的壮观场面。
而在这一片AI大模型之中,阿里旗下的「通义千问」可是备受好评。
这不,在阿里2024年的云栖大会上,通义大模型宣布要重磅升级啦!
这次可不是小打小闹,是史无前例的大动作,最大规模、最大数量的开源,说起来我都有点小激动,非常期待可以用上更多强悍的通义大模型。
自从2024年6月7日,Qwen2发布后,仅2小时,Qwen2-72B就登顶HuggingFace 开源大模型榜单Open LLM Leaderboard第一名,还在多个国际知名评测中大放异彩,赢得了好几个世界第一的头衔。此次发布的Qwen2.5将更加强大,非常值得期待。
而在国内,Compass Arena作为上海人工智能实验室推出的大模型榜单,它专门用来评估中国主流大模型的性能,在这个榜单上,阿里的通义千问Qwen2-72B模型表现非常出色,只比GPT-4o低1分,排在了第二名。
它还超过了其他一些国内的大模型,比如文心4.0和讯飞星火3.5,成为了得分最高的开源大模型。
而在此次阿里2024年云栖大会上,Qwen 2.5 版本它来了!
本次发布阿里云的Qwen 2.5模型可以说是占据了主导地位,模型数量和尺寸规模非常之大。
提供的模型系列非常全面,涵盖LLM、多模态、以及专门针对特定任务优化的模型,这些模型的大小从小巧的0.5版本到强大的72B版本,可以说应有尽有。
无论你是需要处理简单的任务还是复杂的大数据分析,都能满足你的需求,覆盖了各种不同的应用场景。
比如:小巧的0.5B到3B小参数模型非常适合用在耳机、手机这类便携设备上;而7B到32B参数的模型则适合用在机器人、车载系统等更复杂的设备中。
而对于需要处理大量数据和复杂计算的企业或科研机构,72B参数的模型是理想的选择。
通义不仅坚持开源开放,还要将开源开放生态做到极致,它们就像多才多艺的助手一样,不仅能听会看,还能帮你解决数学问题,甚至编写代码。
这些最先进的模型(SOTA)覆盖了各种功能,无论你需要什么,都能找到合适的版本。
为了让开发者更容易地使用这些模型,每个模型都提供了多种不同的版本。
比如基础版(Base)、指导版(Instruct)、以及经过优化的量化版(Quantized),这样大家就可以根据自己的需求和设备条件,选择最合适的模型来部署和使用了。
据统计,阿里云的开源大模型,下载量就超过4000万,是下载量最高的中国大模型。
在Huggingface上,Qwen系列的原生和衍生模型超过五万个,排名全球第二,是仅次于Llama的世界级模型群。
随着2.5版本模型的全新亮相,它们在性能上实现了显著的飞跃,还提供了更多尺寸选择,满足不同的需求。
这些模型不仅运行速度更快、处理能力更强,不难预见,这样的升级将吸引大量用户的关注和下载,毕竟,谁不想拥有最新、最强大的大模型工具呢?
国内金沙江创投主管合伙人朱啸虎:近10年最成功的VC之一,投资孵化出众多独角兽企业。
近期也是在多个场合疯狂点赞Qwen2,他表示“在很多场景下,国内开源模型已经不比闭源模型差,完全足够支撑中国AI应用的发展,尤其在中文知识方面,阿里的通义千问比Llama 3要还强“。
更是直言“对于国内的大模型创业公司,建议大家都用通义开源模型。”
并且通义大模型系列通过阿里云为超过10万家企业提供服务,这些企业覆盖了互联网、金融、汽车、科研、医疗、教育、政务、工业制造和零售等多个领域。
以常见的场景为例:基于阿里云大数据技术及通义大模型,喜马拉雅在AI内容生成、专辑制作、小雅音箱等多个场景切入,推动 AI in ALL。
再比如,基于通义大模型打造的西湖企服数智平台及智能机器人“西小服”,可面向企业提供惠企政策、办事咨询、创业咨询等一站式信息咨询服务。
国产手机vivo已基于阿里云训练自研蓝心大模型,“vivo看见”成为行业内首款多模态大模型视觉辅助产品。
这一广泛的行业覆盖显示了通义大模型的多功能性和适用性,它已经成为国内领先的人工智能基础设施之一。
特别是,通义大模型的开源版本在HuggingFace、魔搭ModelScope等开源社区的累计下载量超过了4000万,这进一步证明了其在业界的影响力和受欢迎程度。
随着技术的不断进步和应用场景的不断拓展,通义大模型有望在未来发挥更加重要的作用。
而今天阿里云栖大会上Qwen2.5的发布更是引起了广泛的关注和讨论,网友们纷纷在社交媒体和专业论坛上发表自己的看法,表达对这一新模型的期待和对它性能的赞赏。
一些技术爱好者和开发者已经开始探讨如何将Qwen2.5应用到自己的项目中,期待能够借助它的强大能力解决实际问题。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-14
手把手教你开发Agent:聊聊DB-GPT Agent的架构设计、源码解读和实战开发
2024-11-14
Alibaba开源UReader:通用免OCR文档理解
2024-11-13
这家小公司的700 亿参数模型竟然比Open o1还强?
2024-11-13
通义牛逼!!比肩Chatgpt-4o 还自带 Artifact
2024-11-13
Ollama 更新!本地跑 LLama3.2,轻量级+视觉能力,能媲美GPT-4o?
2024-11-13
开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版
2024-11-12
字节跳动AI社区新动作:炉米Lumi,一站式模型共创平台揭秘
2024-11-12
我们是这样做大模型应用的(文末有惊喜)
2024-05-06
2024-08-13
2024-07-25
2024-06-12
2024-06-16
2024-07-11
2024-07-20
2024-06-15
2024-07-25
2024-07-25
2024-11-13
2024-11-13
2024-10-07
2024-09-22
2024-09-20
2024-09-14
2024-09-14
2024-09-12