AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
发布日期:2025-01-31 23:01:02 浏览次数: 1538 来源:AI进修生
推荐语

OpenAI再掀AI革命,o3-mini和o3-mini-high推理模型震撼发布。

核心内容:
1. o3-mini和o3-mini-high模型性能对比及适用用户
2. o3系列模型在编码、数学和AGI测试中的突破性表现
3. o3-mini颠覆性创新:自适应思考和性价比突破

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

Insight Daily ?

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

o3-mini和o3-mini high 今天要发布了。

普通用户也获得 o3-mini,plus用户能用上o3-mini high,o3-mini high 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。

plus用户 o3-mini每天能用100次。不过o3-mini high的使用次数限制还需要进一步确认。
有网友说,是的,R1这么火,Openai 按不住了:

而且前面Qwen团队除夕发qwen2.5-max,春节,大家还是要卷,哈哈哈。

其实早在圣诞节直播时,Openai就宣布了o3 mini将在2025年年初提供:

我们还是要说一下什么是 o3 和 o3-mini?
o3:一种在编码、数学甚至面向 AGI 基准测试中表现出色的尖端推理模型。它为智能和问题解决设定了新的基准。
o3-mini:o3 的性价比版本,以极低的成本和速度提供卓越的性能。
这些模型将推理提升到了全新的水平,使复杂任务中的突破成为可能,这些任务需要深入理解和逻辑。
o3来带来三个重大突破。
编程能力:实际编程准确率71.7%,超过o1整整20%。在Codeforces上达到2727分,已经超越人类水平。
数学水平:美国数学奥赛预选赛准确率近97%。就连最难的Epic AI前沿数学题,也能拿到25%的成绩。
最惊人的是Arc AGI测试:87.5%的成绩,首次在这个难度极高的基准测试上超越人类。

为什么 o3-mini 是颠覆性的创新,o3-mini带来两个改变。
自适应思考:可以根据任务难度调整推理深度,选择低、中、高三种模式。让AI更贴近实际使用场景。
性价比突破:比o1-mini成本低,响应更快,效果更好。

不过,网友感叹o3 high每项任务消耗1000美元:

此外,确实现在的模型太多了,具体如何切换模型,我们还有待确认:

? 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询