我要投稿

突发消息！OpenAI 今天发布 2 个新的推理模型：o3-mini 和 o3-mini-high。

发布日期：2025-01-31 23:01:02 浏览次数： 5270 作者：AI进修生

Hi，这里是Aitrainee，欢迎阅读本期新文章。

o3-mini和o3-mini high 今天要发布了。

普通用户也获得 o3-mini，plus用户能用上o3-mini high，o3-mini high 在Codeforce上比o1高约200分，比o1更快、编码和数学表现更佳，成本却还是o1-mini的水平。

plus用户 o3-mini每天能用100次。不过o3-mini high的使用次数限制还需要进一步确认。

有网友说，是的，R1这么火，Openai 按不住了：

而且前面Qwen团队除夕发qwen2.5-max，春节，大家还是要卷，哈哈哈。。。

其实早在圣诞节直播时，Openai就宣布了o3 mini将在2025年年初提供：

我们还是要说一下什么是 o3 和 o3-mini？

o3：一种在编码、数学甚至面向 AGI 基准测试中表现出色的尖端推理模型。它为智能和问题解决设定了新的基准。

o3-mini：o3 的性价比版本，以极低的成本和速度提供卓越的性能。

这些模型将推理提升到了全新的水平，使复杂任务中的突破成为可能，这些任务需要深入理解和逻辑。

o3来带来三个重大突破。

编程能力：实际编程准确率71.7%，超过o1整整20%。在Codeforces上达到2727分，已经超越人类水平。

数学水平：美国数学奥赛预选赛准确率近97%。就连最难的Epic AI前沿数学题，也能拿到25%的成绩。

最惊人的是Arc AGI测试：87.5%的成绩，首次在这个难度极高的基准测试上超越人类。

为什么 o3-mini 是颠覆性的创新，o3-mini带来两个改变。

自适应思考：可以根据任务难度调整推理深度，选择低、中、高三种模式。让AI更贴近实际使用场景。

性价比突破：比o1-mini成本低，响应更快，效果更好。

不过，网友感叹o3 high每项任务消耗1000美元：

此外，确实现在的模型太多了，具体如何切换模型，我们还有待确认：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-28

MCP实战之Agent自主决策-让 AI玩转贪吃蛇

2025-04-28

百度全面接入MCP生态，成为继阿里、腾讯、字节后又一国内科技巨头

2025-04-28

金融大模型推理能力瓶颈如何突破？通义点金提出 DianJin-R1 框架，点石成金！

2025-04-28

深入解读MCP协议最新版本的4大升级【上】：传输机制与安全授权

2025-04-28

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

拨开MCP的迷雾，聊聊LLM工具调用的本质（一）：Function Calling

2025-04-28

推荐支持MCP的六大AI框架

2025-04-27

一文了解Text Embedding模型：从text2vec、openai-text embedding到m3e、bge（上）

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

一文了解：大模型 Agent 开发框架有哪些？它们的区别是什么？

2025-04-27

为什么一定要做Agent智能体？

2025-04-25

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB