微信扫码
添加专属顾问
我要投稿
几乎是毫无预兆,
OpenAI发布OpenAI o1模型,也就是之前所谓的草莓Q模型,它的能力比4o提升了一大截:
o1是一个通过强化学习训练的大型语言模型,分为两个模型,o1预览版和o1 mini,o1 mini版是一个高效、紧凑且经济的模型,推理能力强但普通知识比较弱。
o1预览版每周30条,o1-mini每周50条。
o1显著的特点是具备"思考链"(Chain of Thought)能力。
分解复杂问题:o1能够将一个复杂的问题分解为多个子步骤,然后逐步解决。
自我纠错:在推理过程中,o1能够识别并纠正自己的错误,这大大提高了最终结果的准确性。
尝试多种方法:当一种方法不奏效时,o1能够尝试不同的解题策略,这种灵活性使其能够处理各种各样的问题。
透明的推理过程:o1能够清晰地展示其推理过程,这不仅提高了结果的可解释性,也为进一步改进模型提供了宝贵的洞察。
目前我的Plus账号已经推送了o1-mini和o1-preview的模型。
其他资讯都大同小异,
下面我用著名的海龟汤问题来测试下模型的能力。
接来下我喂给o1几个案例,然后再用一个新的案例考考他:
故事:
一个女人死了,警察在房间发现了很多条这样的字条。
你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\n\n哎,我知道我遇到麻烦了。"
可以看到o1的思考步骤,每次回答基本都会调用内部的推理流程,一开始就花了15秒:
它的问题太让我吃惊了,每个问题都精准的问到点子上,太吓人了:
随着推理的深入,o1的思考时间会变长,思考的步骤逻辑会发生变化和改进,这次花了23秒:
这里它的推理能力是惊人的,几乎复盘了案件的真相:
凶手是死者的伴侣,而且伪造了字条,
有点东西。
到最后o1完全复盘了案件的经过:
甚至还有更精彩的版本:
推理小说以后是不是可以靠o1写了?
大家赶紧去体验一波!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-19
DeepSeek+Dify 构建本地知识库,真香!
2025-04-19
微软开源实时交互模型:提升Agent动态复杂处理能力
2025-04-19
微软最新 Playwright MCP 服务器强势来袭?
2025-04-18
OpenManus:开源版 Manus,无需邀请码,5 分钟极速体验!
2025-04-18
OpenAI开源34页Agents最佳实践白皮书~
2025-04-18
OpenAI推出终端编码智能体Codex CLI了
2025-04-18
“开源版coze”爆火,融资超 4.6 亿!如今 Docker 拉取量超 1 亿,斩获 77.5k star
2025-04-18
【开源看AI】GitDiagram:AI帮你理解任意代码库的架构
2025-01-01
2024-07-25
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-06-12
2024-07-11
2024-08-13
2024-12-26