微信扫码
和创始人交个朋友
我要投稿
马斯克的Grok3 AI模型,全方位对标OpenAI,深度解读其特性与优势。 核心内容: 1. Grok3模型发布背景与时间线 2. Grok3模型分类与推理能力对比 3. Grok3与其他AI模型的性能对比分析
马斯克眼看收购 OpenAI 无望,
直接把自称地表最强AI模型
Grok3 拍了出来。
先来说说时间线,Grok3 目前需要在 Permium+ 或者在 grok.com 使用,一周左右更新完毕,API 要在等几周,语音模式的话还要再等几周,几个月后,Grok2 将会开源。
这个发布方式好眼熟啊,OpenAI 里 OpenAI 气的。而且还有不少细节没有在发布会上公布出来,特别是翻倍的订阅费和每月能领取到的$150 API。作为马斯克头号粉丝,我决定先来一个超级浓缩版。
这十四条信息足以覆盖 Grok3 现阶段的所有信息:
再来从图表上分析一下Grok3的具体性能,有没有水分:
一、领取XAI $150 API额度
我先把更详细的Grok实测视频演示放在后面一点,
先一起薅薅马斯克的羊毛,把每个月$15额度的 XAI API 拿到手,只要 Grok3 的API价格不是贵到离谱,个人使用应该是够够的了。
console.x.ai
,随意选择适合的登陆方式就行Share data
就行。这个选择意味着是将个人数据分享给 XAI 使用,每月可得$150 credits二、基础编程
拿到API后,就等着Grok3上线就行。
因为发布会里面对于数学、科学都是直接以图标的分数来展示效果的。
所以我按照基础编程、物理模拟编程、Deep Search和秘密的语音模型来进一步解析 Grok3 的能力秘密。
因为马斯克很看好 AI 游戏,直播中也透露后续会做一个AI游戏社区。所以实机演示的时候,用 Grok 将《俄罗斯方块》(Tetris)和《宝石迷阵》(Bejeweled)这两款游戏结合起来,创造出一个新的游戏。
这个点是挺新颖的,不是光去复刻已有的游戏,而是创作
一个混合游戏,就是这难度估计有点高,直播好几次都卡在思考过程中了。假设没有做录屏的情况下,最后一次 Grok3 还是成功做出了 demo。
AI正确理解了元素融合。游戏规则不再是传统的俄罗斯方框中的我要凑够一行排满消掉一行,而是正确理解并融合了宝石迷阵的规则,实现了三个颜色一样的方块凑在一起就可以消除一次,确实很棒。
三、物理世界模拟
除了做游戏外,Grok3 也做了最近很火的代码模拟世界,
这波是跟 SpaceX 联动了,让Grok3生成一段飞行器从地球发射到火星再返回地球的3D动画(虽然后续被验证按照这个动画的话,飞行器连地球都飞不出去。。。)
那Grok3在2D维度下做物理模拟效果如何呢?
至少在目前的复刻结果上看,Grok3的编码能力没那么强,Claude含金量还在上涨。
四、UI很好看的DeepSearch
接下来我们看看 DeepSearch,
我听到名字的第一时间就感觉你们是不是真的没有名字可以用了,Deep Search 和 Deep Research 来回用是吧。
虽然名字很 OpenAI,但是实际上更偏向于搜索而不是做研究报告。现阶段做AI搜索关键点的就是信息源,按照之前体验 Grok2 的经验来说,Grok3 + X 的信息源的话,实打实能给OpenAI的AI Search产生威胁,如果在额度上能提升的话,$30的套餐也不是不能接受啊。
现场展示的环节里,Grok3被要求预测 NCAA 疯狂三月赛事的胜负。这个是巴菲特在 2014 年发起的一个活动,历史上无人成功过。抄答案都没地方抄。
从实际演示里面,DeepSearch还是有认真做UI的,在侧边栏做个一个任务面板,我们可以实时检测正在进行的任务。(这个跟OpenAI Operator的侧边栏有点像啊)
五、反复跳票的语音模式
语音模式真的是一波三折,
去年8月的时候,马斯克就已经预告在24年底发布。
但是拖到这次发布会前一个小时,还临时取消发布,改成未来一周后灰度更新。
但还是画了个饼,在发布会最后放出了一段男声,因为时间太短,很难评质量,期待一下中文语音的表现吧。
写在最后
马斯克这波发布会对Grok的改动很大,
之前我对Grok的定位是有幽默感的AI,再加一个画人物图很准。
但这次基础模型、推理模型、语音模型、AI搜索都装上了,
可以说基本上追上了OpenAI的配置。以至于奥特曼在发布会前都有点心痒痒,虽说没发布新模型,但是还是发了个投票,计划后续开源的o3-mini层级的模型
还是端侧模型
。
23年,马斯克发布了33B的Grok 0,性能比肩 70B 的 Llama 2。11月份,又发了Grok 1模型。
24年,马斯克发布了Grok 1.5和Grok 2,还发布了一个多模态模型 Grok-1.5V。到现在的 Grok3,实际上XAI的追赶速度还是很快很快的,可以说不需要再半夜想着收购OpenAI了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-22
以接近零的成本运行 OpenAI Swarm 多 Agent 框架
2025-02-22
一觉醒来,DeepSeek开始“领导”公务员了?
2025-02-22
全国第一例警用 DeepSeek 大模型落地成都高新区:科技赋能警务的创新变革
2025-02-22
AI Agents 技术演进与未来图景:从工具执行者到 AGI 参与者
2025-02-22
橘子对话华创:DeepSeek加速AGI,现在入场正当时
2025-02-22
为什么马斯克认为 Google 才是xAI的终极对手?
2025-02-22
工业大模型:破局工业“觉醒时代”的“三重门”
2025-02-22
通义千问与文心一言对比评测:谁才是苹果AI的“黄金搭档”?
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-05-28
2024-08-04
2024-04-26
2024-07-31
2024-07-09
2024-09-17
2025-02-22
2025-02-22
2025-02-22
2025-02-22
2025-02-21
2025-02-20
2025-02-19
2025-02-16