微信扫码
与创始人交个朋友
我要投稿
OpenAI o3-mini模型的发布,标志着AI技术在推理和搜索能力上的新突破。核心内容:1. o3-mini模型的免费使用政策及其用户分级限制2. 模型支持的三大推理模式及其应用场景3. o3-mini在STEM领域推理优化的表现与优势
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。
Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。
此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。遗憾的是,o3-mini不支持视觉推理。
o3-mini也是 OpenAI 首款支持多项开发者需求特性的小型推理模型,包括函数调用、结构化输出和开发者消息,无需额外调整可直接应用于实际环境中。
o3-mini和OpenAI o1-mini、OpenAI o1-preview 一样,也支持流式传输。开发者还能根据具体应用场景,在低、中、高三种推理强度选项中灵活选择:面对复杂难题时,可选择高推理强度让模型深入思考;面对延迟敏感问题时,可选择低推理强度优先保证速度。
在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。
在美国数学竞赛(AIME 2024)中,低推理强度时o3-mini 与 o1-mini 表现相近,中等推理强度时与o1相当,高推理强度时则超越 o1-mini 和 o1;在博士水平科学问题测试中,不同推理强度的 o3-mini 表现同样出色。
在研究级数学测试里,高推理强度的 o3-mini 表现优于其前代模型;在竞赛编程中,o3-mini 随着推理强度增加,Elo评分逐步提高,均超过 o1-mini,中等推理强度时与o1表现相当;
在软件工程测试中,o3-mini 是表现最佳的模型。在速度上,o3-mini 平均响应时间为7.7 秒,比 o1-mini的10.16秒快了24%。
在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?
感谢新增网络搜索功能,非常喜欢这个。
功能请求:请在 ChatGPT 中添加一个选项,允许选择 DeepSeek R1 作为模型,类似于 Perplexity AI。谢谢!
虽然不支持视觉功能,o3仍然遛的起飞。
在评估 o3-mini 后,到目前为止我对它很满意。很高兴它现在可以在处理我那庞大的代码库时展示其思考过程。注意到 DeepSeek 的影响,这很好,简单的功能就能带来很好的体验,帮助用户保持参与并获得新想法。
o3-mini高推理模式,Plus用户每周只有50条消息?
到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。
本文素材来源OpenAI,如有侵权请联系删除
END
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-02
快速搭建专业AI知识库的开源工具:Ragflow
2025-02-01
奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5
2025-02-01
回应DeepSeek抄袭的质疑,DeepSeek和OpenAI ChatGPT的比较
2025-01-31
吴恩达评DeepSeek:中国 AI 崛起,开源模型重塑行业格局
2025-01-30
我让DeepSeek自己谈它和GPT的区别,大白话版笑死我了
2025-01-29
使用DeepSeek必备的10个技巧
2025-01-29
DeepSeek R1,本地部署才是王道!支持WebUI
2025-01-28
一分钟上手本地运行 DeepSeek
2025-01-01
2024-07-25
2024-05-06
2025-01-21
2024-08-13
2024-06-12
2024-09-20
2024-07-11
2024-07-20
2024-12-26
2025-01-22
2025-01-16
2024-12-24
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13