微信扫码
与创始人交个朋友
我要投稿
OpenAI的o3-mini系列模型免费开放,AI推理能力迎来新突破!核心内容:1. o3-mini系列模型的发布背景及特点2. o3-mini在STEM任务中的卓越表现3. 实战体验与“降智”问题的探讨
清晨六点半,窗外还泛着薄雾般的青灰色,枕边的手机突然发出刺耳的蜂鸣。
迷蒙中伸手摸索着关闭闹钟,一道冷光却猝然刺破昏暗——屏上跳出的消息写着:“o3-mini 来了”。
瞬间,尚未清醒的神经仿佛被注入了一剂浓缩咖啡,我猛地从床上坐起,连拖鞋都来不及穿就冲向了电脑。
今天,OpenAI 发布了两个版本:o3-mini 和 o3-mini-high。
o3-mini 系列:小型推理模型的全新进化
o3-mini 是 OpenAI 推理模型系列的最新力作。
根据官方介绍,这款模型不仅是“轻量级”的代表,更代表了小型 AI 推理模型的一次全面进化:
这款模型在高效推理能力和高效运算处理之间找到了完美的平衡,特别在 STEM(科学、技术、工程、数学) 任务中表现尤为突出。
这次的发布,不仅仅是技术上的一次进步,更是重新定义传统推理模型的边界。
或许是被DeepSeek卷到了,这是OpenAI首次向用户免费推出的推理模型。
同时还支持实时搜索功能,并获得相关网页链接,使得回答更丰富、实时。
OpenAI 提到,这虽然目前还处于原型阶段,但他们正在努力将搜索功能深入整合到推理模型中,以便为用户提供更加精准和实时的反馈。
免费用户可以通过选择“搜索+推理”来使用体验o3-mini。
实战体验:从“降智”疑虑到真实表现
第一次上手,画风是这样的。
我大吃一惊,不至于这么拉胯吧,这是事实吗?
而且这输出的速度也太快了吧,并且没有思考的过程,这里面一定有猫腻。
当我换成电脑,重新测试之后,我发现正常运行的 o3-mini-high 模型,是有思考过程的,而且是全英文,内容如下:
而最终的输出的结果,还是中文(下图所示),干净利落。
那为什么会出现这样的情况?
这让我联想到所谓的 “降智” 问题,也许以后有机会专门开篇讨论这个话题。
另外一个测试,经典问题:
“今天买了三个苹果,我昨天吃了一个,我还有几个呢?”
这一常见问题,许多模型回答失误,而 o3-mini 则毫无问题地给出正确答案。
接下来的网友测试进一步印证 o3-mini 的强大。
o3-mini 可能是最适合现实物理学的大语言模型。
Prompt: "write a python script of a ball bouncing inside a tesseract"
在另一个测试中,o3-mini 同样表现突出:
Prompt: “Write a p5.js script that simulates 100 colorful balls bouncing inside a sphere. Each ball should leave behind a fading trail showing its recent path. The container sphere should rotate slowly. Make sure to implement proper collision detection so the balls stay within the sphere.”
o3-mini 不仅输出精准、迅速,还能准确把握物理法则,完美实现编程与物理模拟的结合。
看一下与DeepSeek-R1对比的测试
Prompt: "write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically"
可以看到,o3-mini的效果更接近实际需求。
接下来,我们来看一下 o3-mini high 在性能、速度和价格上的综合表现,简直让所有竞争对手无地自容。
从图中可以看到,o3-mini high 在 整体表现和编程速度上都遥遥领先。
定价情况
OpenAI 的 o3-mini 定价在不同用户类型和 API 使用下有所不同。
对于 ChatGPT 用户,免费用户只能有限访问 o3-mini(通过选择 “推理”),而 Plus/Team 用户 可享有每日 150 条消息的访问权限,Pro 用户 则可以支付每月 200 美元 获得 无限制访问。
对于 API 用户,定价如下:
与之相比,DeepSeek-R1 的定价显然更具竞争力,输入和输出的费用分别为 0.14 美元 和 0.55 美元,远低于 o3-mini 的收费。
两个月前,强大的推理模型仅通过订阅提供,现如今,无论是 DeepSeek-R1 还是 ChatGPT(o3-mini),都可以免费体验这种强大推理能力。
对于大部分用户和开发者来说,无疑降低了进入门槛,使更多的人能够享受到 AI 推理的强大力量。
当然,o3-mini high 和 o1-pro 等最强模型依然需要付费。
不管怎么样,这对用户来说都是好消息。
另外,在发布会结束后的 Reddit “有问必答”活动中,Sam Altman 也透露出一些行业策略变化:
“我们将比往年保持的领先优势更小”
“重新思考开源策略”
这两点无疑进一步表明在 DeepSeek 带来的冲击下,OpenAI 正在积极调整战略,以适应新一轮的技术变革。
说到最后,重点在这
从清晨惊醒开始,到深入体验 o3-mini 及 o3-mini-high 的表现,我切身体会到这次发布为 AI 推理领域带来的颠覆性改变。
免费策略与实时搜索功能的加入,不仅直接降低使用门槛,也极大提升了应用场景的灵活性和实时性。
你认为这次更新能否真正改变现有 AI 格局?
又或者 DeepSeek 的进步会如何影响未来市场竞争?
感谢看到这里,觉得还不错,
就来个点赞、转发、小心心三连吧~
我们下次再见!?
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-05
3步,0代码!一键部署DeepSeek-V3、DeepSeek-R1
2025-02-05
别被Deepseek低成本冲昏头!本地化部署后续的“甜蜜陷阱”,你真能扛住吗?
2025-02-05
DeepSeek-llm-7B-Chat微调教程
2025-02-05
如何用CAMEL从DeepSeek-R1蒸馏数学推理数据?手把手教你实现!
2025-02-05
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
2025-02-05
基于GiteeAI快速搭建自有DeepSeek
2025-02-04
DeepSeek R1 671B 完整版本地部署教程来了!!!
2025-02-04
一文读懂DeepSeek-R1本地部署配置要求(建议收藏)
2024-09-18
2024-07-11
2024-07-11
2024-07-26
2024-07-09
2024-12-29
2025-02-04
2024-06-11
2024-10-20
2024-09-06