微信扫码
与创始人交个朋友
我要投稿
经过上次Sam预告后
2024年9月12 OpenAI推出 OpenAI o1系列模型
★OpenAI o1 trained with reinforcement learning to perform complex reasoning. o1 thinks before it answers—it can produce a long internal chain of thought before responding to the user.
为了突出对 GPT-4o 的推理提升,我们在各种人类测试和 ML 基准测试中测试了我们的模型。我们表明,在绝大多数这些推理密集型任务中,o1 的性能明显优于 GPT-4o。
目前在 ChatGPT 和 API 中发布了OpenAI o1系列的第一个preview版本,后续会继续更新和改进。
大型语言模型(如 o1)是在大型文本数据集上进行预训练的。虽然这些高容量模型具有广泛的世界知识,但对于实际应用程序来说,它们可能成本高昂且速度缓慢。
o1-mini 是一个较小的模型,针对预训练期间的 STEM 推理进行了优化。在使用与 o1 相同的高计算强化学习 (RL) 管道进行训练后,o1-mini 在许多有用的推理任务上实现了相当的性能,同时显著提高了成本效益。
在需要智能和推理的基准测试中进行评估时,与 o1-preview 和 o1 相比,o1-mini 表现良好。但是,o1-mini 在需要非 STEM 事实知识的任务上表现较差
从目前的观察来看,OpenAI有点苹果化,不同于刚开始在AI领域大刀阔斧的前进,近期发布的产品仍然低于预期,但是不可否认,目前GPT4系列的效果仍然超越同类其他产品。
但是OpenAI o1的发布,说明在探索推理方面可能开创一种新的范式,引导模型“System II thinking”
目前能看到的推测讨论都不太站得住,期待能看到更多的效果测评。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-10-18
阿里云开源 AI 应用开发框架:Spring AI Alibaba
2024-10-18
英伟达推出Nemotron-70B:强大开源语言模型,基准测试中全面领先!
2024-10-17
开源版GPT-4o来了
2024-10-17
还花钱买翻译服务?DeepLX:开源、免费、精准到炸裂!
2024-10-16
对话姬朋飞:从大厂辞职到 Chat2DB 的诞生
2024-10-16
RD-Agent:助力研发流程自动化的AI创新工具。
2024-10-15
TeleAI 开源星辰语义大模型-TeleChat2!
2024-10-14
开源OCR工具Surya:新增表格识别功能
2024-08-13
2024-05-06
2024-06-12
2024-07-25
2024-07-08
2023-07-01
2024-06-16
2024-07-11
2024-07-18
2024-06-15