AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


o3-mini来了,OpenAI首个可以免费用的推理模型!还是被DeepSeek卷到了!
发布日期:2025-02-02 10:36:42 浏览次数: 1762 来源:AI小岛
推荐语

OpenAI的o3-mini系列模型免费开放,AI推理能力迎来新突破!

核心内容:
1. o3-mini系列模型的发布背景及特点
2. o3-mini在STEM任务中的卓越表现
3. 实战体验与“降智”问题的探讨

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

清晨六点半,窗外还泛着薄雾般的青灰色,枕边的手机突然发出刺耳的蜂鸣。

迷蒙中伸手摸索着关闭闹钟,一道冷光却猝然刺破昏暗——屏上跳出的消息写着:“o3-mini 来了”。

瞬间,尚未清醒的神经仿佛被注入了一剂浓缩咖啡,我猛地从床上坐起,连拖鞋都来不及穿就冲向了电脑。

今天,OpenAI 发布了两个版本:o3-mini 和 o3-mini-high。

o3-mini 系列:小型推理模型的全新进化

o3-mini 是 OpenAI 推理模型系列的最新力作。

根据官方介绍,这款模型不仅是“轻量级”的代表,更代表了小型 AI 推理模型的一次全面进化:

这款模型在高效推理能力和高效运算处理之间找到了完美的平衡,特别在 STEM(科学、技术、工程、数学) 任务中表现尤为突出。

这次的发布,不仅仅是技术上的一次进步,更是重新定义传统推理模型的边界。

或许是被DeepSeek卷到了,这是OpenAI首次向用户免费推出的推理模型。

同时还支持实时搜索功能,并获得相关网页链接,使得回答更丰富、实时。

OpenAI 提到,这虽然目前还处于原型阶段,但他们正在努力将搜索功能深入整合到推理模型中,以便为用户提供更加精准和实时的反馈。

免费用户可以通过选择“搜索+推理”来使用体验o3-mini。

实战体验:从“降智”疑虑到真实表现

第一次上手,画风是这样的。

我大吃一惊,不至于这么拉胯吧,这是事实吗?

而且这输出的速度也太快了吧,并且没有思考的过程,这里面一定有猫腻。

当我换成电脑,重新测试之后,我发现正常运行的 o3-mini-high 模型,是有思考过程的,而且是全英文,内容如下:

而最终的输出的结果,还是中文(下图所示),干净利落。

那为什么会出现这样的情况?

这让我联想到所谓的 “降智” 问题,也许以后有机会专门开篇讨论这个话题。

另外一个测试,经典问题:

“今天买了三个苹果,我昨天吃了一个,我还有几个呢?”

这一常见问题,许多模型回答失误,而 o3-mini 则毫无问题地给出正确答案。

接下来的网友测试进一步印证 o3-mini 的强大。

o3-mini 可能是最适合现实物理学的大语言模型。

Prompt: "write a python script of a ball bouncing inside a tesseract"

在另一个测试中,o3-mini 同样表现突出: 

Prompt: “Write a p5.js script that simulates 100 colorful balls bouncing inside a sphere. Each ball should leave behind a fading trail showing its recent path. The container sphere should rotate slowly. Make sure to implement proper collision detection so the balls stay within the sphere.”

o3-mini 不仅输出精准、迅速,还能准确把握物理法则,完美实现编程与物理模拟的结合。

看一下与DeepSeek-R1对比的测试

Prompt: "write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically"

可以看到,o3-mini的效果更接近实际需求。

接下来,我们来看一下 o3-mini high 在性能、速度和价格上的综合表现,简直让所有竞争对手无地自容。

从图中可以看到,o3-mini high 在 整体表现和编程速度上都遥遥领先。

定价情况

OpenAI 的 o3-mini 定价在不同用户类型和 API 使用下有所不同。

对于 ChatGPT 用户,免费用户只能有限访问 o3-mini(通过选择 “推理”),而 Plus/Team 用户 可享有每日 150 条消息的访问权限,Pro 用户 则可以支付每月 200 美元 获得 无限制访问。

对于 API 用户,定价如下:

与之相比,DeepSeek-R1 的定价显然更具竞争力,输入和输出的费用分别为 0.14 美元 和 0.55 美元,远低于 o3-mini 的收费。

两个月前,强大的推理模型仅通过订阅提供,现如今,无论是 DeepSeek-R1 还是 ChatGPT(o3-mini),都可以免费体验这种强大推理能力。

对于大部分用户和开发者来说,无疑降低了进入门槛,使更多的人能够享受到 AI 推理的强大力量。

当然,o3-mini high 和 o1-pro 等最强模型依然需要付费。

不管怎么样,这对用户来说都是好消息。

另外,在发布会结束后的 Reddit “有问必答”活动中,Sam Altman 也透露出一些行业策略变化:

“我们将比往年保持的领先优势更小”

“重新思考开源策略”

这两点无疑进一步表明在 DeepSeek 带来的冲击下,OpenAI 正在积极调整战略,以适应新一轮的技术变革。

说到最后,重点在这

从清晨惊醒开始,到深入体验 o3-mini 及 o3-mini-high 的表现,我切身体会到这次发布为 AI 推理领域带来的颠覆性改变。

免费策略与实时搜索功能的加入,不仅直接降低使用门槛,也极大提升了应用场景的灵活性和实时性。

你认为这次更新能否真正改变现有 AI 格局?

又或者 DeepSeek 的进步会如何影响未来市场竞争?

官方介绍入口:openai.com/index/openai-o3-mini

- End -

点这里? 关注我,记得标星 ⭐ 
会第一时间收到推送哦~


感谢看到这里,觉得还不错,

就来个点赞、转发、小心心三连吧~

我们下次再见!?

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询