我要投稿

跳过GPT-5 ，OpenAI 推出全新 AI模型 o1

发布日期：2024-09-13 12:45:30 浏览次数： 1981 作者：给力商讯

OpenAI 推出全新推理模型 o1

人工智能领域的先锋 OpenAI 近日发布了一款名为 o1 的新模型，这是一系列计划中的“推理”模型中的首款，旨在以超越人类的速度回答更复杂的问题。同时发布的还有 o1-mini，一个更小型、更经济的版本。没错，如果你对 AI 界的传闻有所耳闻，这正是备受瞩目的 Strawberry 模型。

迈向AGI的一大步

自 2023年3月 OpenAI 发布其强大的专有大型语言模型（LLM）GPT-4 以来，已经过去了18个月，用户和开发者一直在猜测这家在硅谷乃至全球掀起生成型 AI 热潮的公司何时会发布下一个版本，预计名为 GPT-5。

事实证明，GPT 系列暂时被一个全新的模型家族所超越。

今天，在最近几天加剧的数月报告和传言之后，OpenAI 宣布推出其“o1” AI 模型家族，包括两个模型：o1-preview 和 o1-mini，公司表示这些模型旨在“通过复杂任务进行推理并解决比 GPT 系列模型更难的问题”。

两个模型今天都对 ChatGPT Plus 用户开放，但最初限制为 o1-preview 每周 30 条消息，o1-mini 每周 50 条。

然而，OpenAI 也警告说，“作为一个早期模型，它还没有许多使 ChatGPT 有用的功能，比如浏览网页获取信息和上传文件和图像。对于许多常见情况，在近期内 GPT-4o 将更有能力。”

事实上，我们最初尝试使用它为本文创建图像的测试发现它无法做到。在 OpenAI 的 API 平台网站上，公司明确表示，在 beta 状态下，模型家族支持“仅限文本，不支持图像”。

o1 比 GPT 做得更好的方面

OpenAI 声称其新的 o1 系列特别适合用户在科学、医疗保健和技术等领域解决复杂问题。

OpenAI 构想这些模型被用于广泛的应用，从帮助物理学家为量子光学生成数学公式，到协助医疗保健研究人员注释细胞测序数据。

开发者还会发现 o1-mini 模型对于构建和执行多步骤工作流程、调试代码和高效解决编程挑战非常有效。

用 OpenAI o1 破解逻辑谜题：

o1-preview 达到博士级表现

o1-preview 模型旨在通过投入更多时间思考和完善其响应来处理具有挑战性的任务，类似于一个人如何处理复杂问题。在测试中，这种方法使模型在物理、化学和生物等领域的表现接近博士生的水平。

OpenAI o1 和量子物理：

此外，o1-preview 模型在编码方面表现出色，在 Codeforces 竞赛中排名 89 百分位，展示了其处理多步骤工作流程、调试复杂代码和生成准确解决方案的能力。

在国际数学奥林匹克竞赛（IMO）资格赛等基准任务中，o1-preview 通过解决 83% 的问题展示了其能力，这是其前身 GPT-4o 13% 成功率的显著提高。

OpenAI o1 和代码:

它已经可以在 ChatGPT 中由 Plus 和 Team 用户使用，企业版和教育版用户将在下周获得访问权限。这些模型也通过 OpenAI API 向有资格使用 API 使用层 5 的开发者提供，尽管最初将适用速率限制。

o1-mini 功能较弱但便宜 80%

与 o1-preview 同时，OpenAI 还推出了 o1-mini 模型，这是一个更精简的版本，旨在提供更快、更便宜的推理能力。

虽然主要针对编码和 STEM 任务进行了优化，但 o1-mini 仍然表现出色，特别是在数学和编程方面。

在 IMO 数学基准测试中，o1-mini 得分 70%，几乎与 o1-preview 的 74% 相匹配，同时提供了显著更低的推理成本。它在编码评估中也表现出色，在 Codeforces 上获得了 1650 的 Elo 分数，使其位于前 86% 的程序员之列。

与 o1-preview 相比，价格低了 80%，o1-mini 针对需要推理能力的开发者和研究人员，他们不需要更高级的 o1-preview 模型提供的更广泛知识。

这种性价比高的解决方案也将向 ChatGPT Plus、Team、Enterprise 和 Edu 用户开放，并计划将来向 ChatGPT Free 用户扩展访问权限。

安全和安全增强

根据 OpenAI 对安全的承诺，两个模型都采用了新的安全训练方法，增强了它们遵循安全和对齐指南的能力。

OpenAI 强调，o1-preview 在其最艰难的越狱测试中得分 84，比 GPT-4o 的 22 分有了显著提高。在上下文中对安全规则进行推理的能力使这些模型能够更好地处理不安全的提示，并避免生成不适当的内容。

作为更广泛安全工作的一部分，OpenAI 已与美国和英国的 AI 安全研究所达成协议。

这些合作伙伴关系包括授予研究版本的 o1 模型的早期访问权限，以帮助评估和测试未来的 AI 系统。

OpenAI 的安全工作还包括全面的内部治理和与联邦政府的合作，由公司的 Safety & Security Committee 进行定期测试、红队和董事会层面的监督。

OpenAI 的 o1 系列下一步是什么

尽管 o1-preview 和 o1-mini 模型是推理和解决问题的强大工具，但 OpenAI 承认这只是开始。

公司计划定期更新和改进这些模型，包括添加目前 API 版本中尚不可用的功能，如浏览、文件和图像上传以及函数调用。

展望未来，OpenAI 将继续开发其 GPT 和 o1 系列，进一步扩展 AI 在各个领域的能力。随着公司努力提高这些模型在不同应用程序中的实用性和可访问性，用户可以期待持续的进步。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

DeepSeek + Dify 企业级大模型私有化部署指南

2025-04-24

自主构建MCP，轻松实现云端部署！

2025-04-24

大模型微调框架LLaMA-Factory

2025-04-23

Unsloth：提升 LLM 微调效率的革命性开源工具

2025-04-23

超越 DevOps？VibeOps 引领 AI 驱动的开发革命

2025-04-23

大模型想 “专精” 特定任务？这 3 种 Addition-Based 微调法别错过

2025-04-23

重参数化微调：揭秘LoRA家族让大模型训练成本暴降的方法

2025-04-23

为什么全参数微调能让大模型从“通才”变“专才”？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

FP8 低精度训练：Transformer Engine 简析

2024-07-11

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

大家都在问

为什么全参数微调能让大模型从“通才”变“专才”？

2025-04-23

MCP vs Function Calling，该如何选？

2025-04-20

RAGFlow vs Dify, 商业化落地场景选哪个？

2025-04-01

如何利用Dify轻松构建你的专属语料库？

2025-03-31

从 0 到 1，Agentic Ops 如何打造企业级 AI 生产力？

2025-03-20

DeepSeek-R1的Qwen-32B蒸馏模型与QwQ-32B模型，谁更强？

2025-03-16

部署DeepSeek的4条路，企业级客户到底该咋走？

2025-03-16

谷歌Gemma 3 27b 到底能不能打，写个游戏测试下？

2025-03-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB