AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


刚刚,马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学推理!彻底碾压 OpenAI...

发布日期:2025-02-18 21:47:22 浏览次数: 1789 来源:G人工智能
推荐语

马斯克的 AI 革命!20万块 GPU 炼出史上最强 AI 模型 Grok-3,彻底碾压 OpenAI

核心内容:
1. Grok-3 计算地球到火星的发射窗口,生成 3D 轨道模拟,得到 NASA 工程师认可
2. Grok-3 在数学、科学问答、编码等基准测试中全面夺冠,刷新 AIME 2025 数学测试纪录
3. Grok-3 训练计算量是 Grok-2 的 10倍,在全球最大超算集群 Colossus 上训练,Elo 评分突破 1400

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

马斯克自信表示:“Grok-3 是地球上最聪明的 AI 大模型!”


刚刚,直播发布的 Grok-3 太强了!马斯克的 xAI 团队用 20万块 GPU 训练出史上最强 AI 模型,一举超越 DeepSeek-R1、GPT-4o、o1 等热门 AI 大模型。

研究人员向 Grok-3 提出一个高难度问题:“计算地球到火星的发射窗口,并生成 3D 轨道模拟。”
Think 模式(高级推理模式)下,Grok-3 详细计算:

  1. 使用开普勒定律,计算火星到地球的最优转移轨道。

  2. 生成完整 3D 动画,展示飞船航行路径。

  3. 提供精确返回窗口,并得到 NASA 工程师的认可:“Grok-3 的计算完全正确!”

相比之下,GPT-4、o1、o3-mini(high)等模型在相同任务上全部失败。
不仅如此,Grok-3 的推理能力惊人,在数学、科学问答、编码等基准测试中全面夺冠,甚至刷新了 AIME 2025 数学测试纪录。
感觉这是马斯克对 OpenAI 的正式反击!

20万块 GPU 训练,Grok-3 真的无敌!xAI 团队披露,Grok-3 的训练计算量达到了 Grok-2 的 10倍,并且是在全球最大超算集群 Colossus 上训练

10万块 H100 GPU,第一阶段耗时 122 天
20万块 H100 GPU,第二阶段耗时 92 天

最新 LMSYS Arena 排行榜显示 Grok-3 数学能力封神!

Grok-3 Elo 评分突破 1400,当前全球 AI 之巅!
在 数学基准 AIME 2025 测试中,Grok-3 取得 93 分(满分 100),几乎达到数学专业级别。
科学问答(GPQA)、编码(LCB)等多个领域全面刷新 SOTA(最先进水平)。
DeepSeek-R1、Gemini-2 Pro、GPT-4o 在这些测试中,全部被拉开差距。
DeepSearch:Grok-3 的 AI 版 Google,搜索能力惊艳!
马斯克不仅要做最聪明的 AI,这次还带来了一个搜索神器——DeepSearch
这个 AI 智能体不仅能搜索全网信息,还能结合 AI 推理,提供高质量答案。
研究人员输入问题:
“下一次 SpaceX 星舰发射是什么时候?”
DeepSearch 立刻联网检索,并在左侧显示整个搜索和推理过程,最终精准回答:“2025年2月24日。”(数据来源:SpaceX 官网)
这比传统搜索引擎快数倍!且不需要翻阅大量网页。

订阅 Premium Plus,提前体验 Grok-3!

想第一时间体验 Grok-3?现在订阅 X 平台的 Premium Plus 会员即可解锁!

网页版入口:grok.com
App Store 下载:搜索 Grok AI
高级推理 & DeepSearch 体验:需订阅 SuperGrok 版本
马斯克承诺:一周内,Grok-3 所有功能上线,几个月内全面开源!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询