我要投稿

o3-mini来了，OpenAI首个可以免费用的推理模型！还是被DeepSeek卷到了！

发布日期：2025-02-02 10:36:42 浏览次数： 2435 作者：AI小岛

清晨六点半，窗外还泛着薄雾般的青灰色，枕边的手机突然发出刺耳的蜂鸣。

迷蒙中伸手摸索着关闭闹钟，一道冷光却猝然刺破昏暗——屏上跳出的消息写着：“o3-mini 来了”。

瞬间，尚未清醒的神经仿佛被注入了一剂浓缩咖啡，我猛地从床上坐起，连拖鞋都来不及穿就冲向了电脑。

今天，OpenAI 发布了两个版本：o3-mini 和 o3-mini-high。

o3-mini 系列：小型推理模型的全新进化

o3-mini 是 OpenAI 推理模型系列的最新力作。

根据官方介绍，这款模型不仅是“轻量级”的代表，更代表了小型 AI 推理模型的一次全面进化：

这款模型在高效推理能力和高效运算处理之间找到了完美的平衡，特别在 STEM（科学、技术、工程、数学）任务中表现尤为突出。

这次的发布，不仅仅是技术上的一次进步，更是重新定义传统推理模型的边界。

或许是被DeepSeek卷到了，这是OpenAI首次向用户免费推出的推理模型。

同时还支持实时搜索功能，并获得相关网页链接，使得回答更丰富、实时。

OpenAI 提到，这虽然目前还处于原型阶段，但他们正在努力将搜索功能深入整合到推理模型中，以便为用户提供更加精准和实时的反馈。

免费用户可以通过选择“搜索+推理”来使用体验o3-mini。

实战体验：从“降智”疑虑到真实表现

第一次上手，画风是这样的。

我大吃一惊，不至于这么拉胯吧，这是事实吗？

而且这输出的速度也太快了吧，并且没有思考的过程，这里面一定有猫腻。

当我换成电脑，重新测试之后，我发现正常运行的 o3-mini-high 模型，是有思考过程的，而且是全英文，内容如下：

而最终的输出的结果，还是中文（下图所示），干净利落。

那为什么会出现这样的情况？

这让我联想到所谓的 “降智” 问题，也许以后有机会专门开篇讨论这个话题。

另外一个测试，经典问题：

“今天买了三个苹果，我昨天吃了一个，我还有几个呢？”

这一常见问题，许多模型回答失误，而 o3-mini 则毫无问题地给出正确答案。

接下来的网友测试进一步印证 o3-mini 的强大。

o3-mini 可能是最适合现实物理学的大语言模型。

Prompt: "write a python script of a ball bouncing inside a tesseract"

在另一个测试中，o3-mini 同样表现突出：

Prompt: “Write a p5.js script that simulates 100 colorful balls bouncing inside a sphere. Each ball should leave behind a fading trail showing its recent path. The container sphere should rotate slowly. Make sure to implement proper collision detection so the balls stay within the sphere.”

o3-mini 不仅输出精准、迅速，还能准确把握物理法则，完美实现编程与物理模拟的结合。

看一下与DeepSeek-R1对比的测试

Prompt: "write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically"

可以看到，o3-mini的效果更接近实际需求。

接下来，我们来看一下 o3-mini high 在性能、速度和价格上的综合表现，简直让所有竞争对手无地自容。