支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI o3 和 o4-mini 多模态推理新模型重磅来袭

发布日期:2025-04-17 05:30:47 浏览次数: 1641 作者:硅基心脏
推荐语

OpenAI 最新多模态推理模型o3和o4-mini,开启智能推理新纪元。

核心内容:
1. o3和o4-mini模型的突破性推理能力和工具使用
2. 模型在学术基准测试和实际应用中的卓越性能
3. Codex CLI工具的创新特性和百万美元资助计划

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
就在刚刚,OpenAI 发布了其 o 系列模型的最新成员 o3 和 o4-mini,这两款模型被认为是 OpenAI 迄今为止最智能的模型。它们经过训练后能够在做出反应前进行更长时间的思考,并且首次具备智能地使用和组合 ChatGPT 的所有工具的能力,包括网页搜索、Python 分析、视觉推理和图像生成。
模型能够自主判断何时以及如何使用这些工具,从而以正确的格式生成详细且周到的答案,更有效地处理复杂问题。这一突破性的推理能力与完全的工具访问权限相结合,使得新模型在学术基准测试和实际应用中都展现出显著的性能提升。
o3 在编码、数学、科学和视觉感知等领域打破了多项基准记录
它尤其擅长处理需要多方面分析的复杂查询,并在分析视觉信息方面表现出色。专家评估显示,相比 o1,o3 在困难的现实任务中重大错误减少了 20%,尤其在编程、商业咨询和创意构思方面。
o4-mini 作为更小、更高效的模型,o4-mini 在保持卓越性能的同时,实现了快速且经济高效的推理,尤其在数学、编程和视觉任务方面表现突出,并为 AIME 设定了新的 SOTA。专家评估还显示,o4-mini 在非 STEM 任务和数据科学领域超越了其前身 o3-mini。由于其高效率,o4-mini 拥有更高的使用限制,适合高容量、高吞吐量的推理需求。
o3 侧重于强大的综合能力,而 o4-mini 则强调效率和速度,这两个模型与之前的推理模型相比,它们的体验也更加自然和更具对话性,尤其在参考记忆和历史对话时,响应更加个性化和相关

同时,OpenAI 推出了一个名为 Codex CLI 的全新实验性工具,这是一个可在终端运行的轻量级编码代理,旨在将前沿推理能力带到命令行。

  • 终端中的强大推理:
    Codex CLI 旨在充分利用 o3 和 o4-mini 等模型的推理能力,并计划支持更多 API 模型,如 GPT-4.1。
  • 本地多模态推理:
    该工具的独特之处在于能够通过传递屏幕截图或低保真草图,在本地命令行环境中实现多模态推理,并能访问本地代码。
  • 极简连接接口:
    OpenAI 将其视为一个将模型直接连接到用户及其计算机的极简接口。
  • 完全开源:
    Codex CLI 已完全开源,代码可在获取。
  • 百万美元资助计划:
    OpenAI 还宣布启动一项 100 万美元的计划,以支持使用 Codex CLI 和 OpenAI 模型进行的项目。资助将以 API 积分的形式发放,每笔最高 2.5 万美元。提案可以通过提供的链接提交。


总之,Codex CLI 是一个创新的开源工具,旨在将 OpenAI 最先进的推理能力直接带到开发者的终端,并支持通过多模态输入进行交互。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询