微信扫码
与创始人交个朋友
我要投稿
谷歌最新大模型Gemini 2.0 Pro评测报告,性能全面超越前代,支持200万输入,开发者免费体验!核心内容:1. Gemini 2.0 Pro性能评测:超越DeepSeekV3,略逊于DeepSeekR12. Gemini系列大模型发展回顾:从1.0到2.0 Pro的演进历程3. Gemini 2.0 Pro亮点解析:支持200万tokens上下文,开发者免费试用
本文原文来自DataLearnerAI官方博客:
https://www.datalearner.com/blog/1051738816087139
2025年2月5日,Google官方宣布Gemini 2.0 Pro版本上线,Gemini系列是谷歌最新一代大模型的品牌名称。Google最早在2024年12月中旬发布了Gemini 2.0系列的第一个模型Gemini 2.0 Flash,当时试用的人都普遍反应这个模型速度又快,结果友好,让Google摆脱了此前大模型很落后的印象。今天,Gemini 2.0 Pro上线,其能力更强。
一、Google Gemini系列模型回顾
Gemini 1.0 Series (2023年12月发布):
Gemini 1.5 Series (2024年5月发布):
Gemini 2.0 Flash Experimental(2024年12月发布):
Gemini 2.0 Series (2025年2月发布):
Gemini 2.0 Flash-Lite简介:更快的Gemini 1.5 Flash平替模型
Gemini 2.0 Pro简介:支持200万tokens上下文的大模型
总结与展望
虽然Google最新的模型很不错,但是Google大模型系列的产品有点混乱,我们先来回顾一下Gemini模型的发布情况。
2023年12月份,Google发布了Bard模型的升级版本Gemini系列,当时发布的时候仅包含Gemini Ultra、Gemini Pro和Gemini Nano,参数规模依次递减,其中Nano系列是移动端的模型(这部分的信息可以参考此前DataLearnerAI的博客介绍:谷歌发布号称超过GPT-4V的大模型Gemini:4个版本,最大的Gemini的MMLU得分90.04,首次超过90的大模型)。
此后,Google陆续发布了1.5系列的模型,并引入了Gemini 1.5 Flash这个新的系列。
2024年12月,Google发布了Gemini 2.0 Flash的实验版本,后缀是Experimental,这个版本的模型发布让大家对Google的大模型有了很大的改观,原因是这个模型的代码生成能力非常好,效果与GPT-4o系列几乎不相上下,同时因为其速度快,开发者每天有免费使用的额度,被广泛使用。具体参考DataLearnerAI的博客:Google发布第二代Gemini大语言模型,首个登场的Gemini 2 Flash Experimental,评测结果显示其能力已经超越上一代的Gemini 1.5 Pro!
今天,Google又发布了3个2.0版本的Gemini系列模型,就是本文要介绍的。
让我们总结一下这个混乱的模型发布节奏:
Gemini Ultra
Gemini Pro
Gemini Nano
Gemini 1.5 Pro
Gemini 1.5 Flash
Gemini 2.0 Flash Experimental
Gemini 2.0 Flash Thinking (Experimental)
Gemini 2.0 Flash-Lite (Public Preview)
Gemini 2.0 Flash (GA - Generally Available)
Gemini 2.0 Pro (Experimental)
今天,Google发布了Gemini 2.0 Flash的正式版本,同时也可以发布了一个更加小巧便宜的Gemini 2.0 Flash-Lite以及更大规模更强的Gemini 2.0 Pro。
Gemini 2.0 Flash去掉了实验标签也意味着它正式发布。而官方也没有给这个模型更多的介绍,意味着去除这个标签本身可能也没有更大的提升。因此,今天的主角是Gemini 2.0 Flash-Lite和Gemini 2.0 Pro Experimental。
从命名可以看到,Google的这个模型是Gemini 2.0 Flash的一个小规模参数的版本,它更快,但是比Gemini 2.0 Flash效果略差,好于上一代的Gemini 1.5 Flash。
而从官方的对比来看,我们又一次看到Google产品的混乱。
在Google官方的博客中,他们用Gemini 2.0 Flash-Lite对比上一代的Gemini 1.5 Flash。官方说,这个模型的目标是希望持续改进大模型的能力,但是保持价格不表。因此,与Gemini 1.5 Flash相比,这个模型的价格保持不变,但是各方面都有提升。
上表可以看出两个模型的评测结果对比。可以看到,大部分的评测基准上,新模型都有提升,且幅度客观。有2个指标下降。但是谷歌官方的价格不变,结尾加了Lite,很难让人理解这个模型的定位。但是同时意味着,Gemini 2.0 Flash相比较上一代产品价格上涨了!
如下表所示:
从这个图可以看到,Gemini 1.5 Flash还根据上下文长度不同,定价有区分。而Gemini 2.0系列已经取消这个价格差异。但是同系列的Gemini 2.0 Flash价格略有上涨。
Gemini 2.0 Flash-Lite模型更多信息参考DataLearnerAI模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/gemini-2_0-flash-lite
这是目前Google发布的在编码性能和处理复杂提示方面表现最出色的模型。它具有更强的理解和推理能力,可以分析和理解大量信息。此外,它还支持调用Google搜索和代码执行等工具。
Gemini 2.0 Pro是一个多模态的大模型,其中输入最大支持200万token的超大上下文窗口,输出支持8K。应该是目前为止规模最大的一类了。这个模型训练的知识截止到2024年6月份。
这个模型相比较Google的其他模型也是效果显著:
可以看到,在所有评测基准上,Gemini 2.0 Pro都是最强的。
就MMLU Pro得分来说(更难更有区分力的大模型综合评测基准,MMLU的升级版本,MMLU Pro具体信息参考:https://www.datalearner.com/blog/1051734400735235 ),Gemini 2.0 Pro也是除了当前业界推理大模型o1和R1外最强的大模型了。也就是说,抛开两个推理大模型,这是当前业界最强的大模型。
官方给的Gemini 2.0 Pro的模型信息卡如下:
这意味着,当前开发者每天可以免费使用50次Gemini 2.0 Pro模型,相比较Gemini 2.0 Flash的1500次大幅降低。也意味着这个模型的成本可能远高于Gemini 2.0 Flash。
关于Gemini 2.0 Pro模型更多信息参考DataLearnerAI模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/gemini_2_pro
Gemini 2.0系列模型的发布,标志着Google在AI领域的又一次重要进展。无论是开发者还是普通用户,都可以从Gemini 2.0中获益。Gemini系列无论是速度还是效果都可以称为业界最强模型之一,也让Google摆脱了在大模型领域的能力落后的标签。这个模型的价格和效果非常值得大家测试使用。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-06
TI-ONE时间 | 全网最详细DeepSeek部署操作指南
2025-02-06
谷歌反击,最强Gemini 2.0全家桶砸场DeepSeek!物理模拟编码惊人Jeff Dean站台
2025-02-06
DeepSeek R1 给我的冲击
2025-02-06
大模型涉及到的精度有多少种?FP32、TF32、FP16、BF16、FP8、FP4、NF4、INT8都有什么关联,一文讲清楚
2025-02-06
“AI三杰”都是广东人,为何都没在广东发展?
2025-02-06
Google Gemini 2.0 Pro来袭,DeepSeek突然觉得不香了?
2025-02-05
Gemini 2.0 Flash小试牛刀
2025-02-05
DeepSeek 对国内互联网巨头的影响
2024-08-13
2024-09-23
2024-06-13
2024-05-28
2024-08-21
2024-04-26
2024-08-04
2024-07-09
2024-07-01
2024-09-17
2025-02-06
2025-02-06
2025-02-04
2025-02-01
2025-02-01
2025-02-01
2025-02-01
2025-01-29