AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


超级重磅!刚刚OpenAI发布全新推理模型o1系列,IMO正确率高达83%
发布日期:2024-09-13 06:09:47 浏览次数: 1724 来源:AI寒武纪


OpenAI放大招!全新推理模型o1系列来了,解题能力堪比博士生!

就在5分钟前,OpenAI发布了全新的 AI 模型系列——OpenAI o1,主打推理能力,号称能解决比以往模型更难的科学、编程和数学问题!

先别急着激动,这次只是预览版! OpenAI 表示,o1 系列模型还将进行定期更新和改进,后续还会加入更多功能,例如网页浏览、文件和图像上传等。

那么,o1 系列模型到底有多牛呢?

推理能力大幅提升: OpenAI 表示,o1 模型在物理、化学和生物等学科的 challenging 基准测试中,表现与博士生相当

数学和编程能力爆表: 在一项国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 的正确率只有 13%,而 o1 模型的正确率高达 83%!在 Codeforces 编程竞赛中,o1 模型的成绩也达到了前 89%!

o1 系列模型的工作原理:

更像人类一样思考: o1 系列模型经过训练,能够花更多时间思考问题,尝试不同的策略,并识别自己的错误,就像人类一样!

o1 系列模型的安全性:

全新安全训练方法: OpenAI 开发了一种新的安全训练方法,利用 o1 模型的推理能力,让它们更好地遵守安全和对齐准则

更强的“越狱”抵抗力: OpenAI 用“越狱”测试来衡量模型的安全性,结果显示 o1 模型比 GPT-4o 更不容易被“越狱”

o1 系列模型的应用场景:

科学研究: o1 模型可以帮助医疗研究人员分析细胞测序数据,帮助物理学家生成复杂的数学公式

编程开发: o1 模型可以帮助开发者构建和执行多步骤工作流程。

o1 系列模型的两个版本:

o1-preview: 预览版模型,功能相对较少,但推理能力强大

o1-mini: 更小、更快的推理模型,特别擅长编程,成本也更低

如何使用 OpenAI o1?

ChatGPT Plus 和 Team 用户: 现在就可以在 ChatGPT 中使用 o1-preview 和 o1-mini 模型

ChatGPT Enterprise 和 Edu 用户: 下周开始可以使用这两个模型

API 用户: 符合条件的开发者现在就可以在 API 中使用这两个模型,但功能有限,例如不支持函数调用、流式传输、系统消息等

ChatGPT Free 用户: OpenAI 计划在未来向所有 ChatGPT Free 用户开放 o1-mini 模型

OpenAI 的未来计划:

继续改进 o1 系列模型, 添加更多功能,例如网页浏览、文件和图像上传等

继续开发 GPT 系列模型, 与 o1 系列模型并行发展


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询