AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI突然放出o1——我用海龟汤问题测试后o1可以用来出版推理小说了
发布日期:2024-09-13 08:26:09 浏览次数: 1615


几乎是毫无预兆,

OpenAI发布OpenAI o1模型,也就是之前所谓的草莓Q模型,它的能力比4o提升了一大截:



o1是一个通过强化学习训练的大型语言模型,分为两个模型,o1预览版和o1 mini,o1 mini版是一个高效、紧凑且经济的模型,推理能力强但普通知识比较弱。

o1预览版每周30条,o1-mini每周50条。

o1显著的特点是具备"思考链"(Chain of Thought)能力。

分解复杂问题:o1能够将一个复杂的问题分解为多个子步骤,然后逐步解决。

自我纠错:在推理过程中,o1能够识别并纠正自己的错误,这大大提高了最终结果的准确性。

尝试多种方法:当一种方法不奏效时,o1能够尝试不同的解题策略,这种灵活性使其能够处理各种各样的问题。

透明的推理过程:o1能够清晰地展示其推理过程,这不仅提高了结果的可解释性,也为进一步改进模型提供了宝贵的洞察。


目前我的Plus账号已经推送了o1-mini和o1-preview的模型。



其他资讯都大同小异,

下面我用著名的海龟汤问题来测试下模型的能力。

海龟汤游戏是一种推理游戏,其中玩家需要根据一个简短的故事背景(“汤面”)猜测出隐藏的故事真相(“汤底”)。
游戏的规则很简单:玩家可以提出是/否类型的问题,裁判只能根据已知的“汤底”来判断问题的答案。
比如用户可能会问:汤里有毒药吗?
裁判就会回答:不是。
这个循环直到用户猜到真相为止。


接来下我喂给o1几个案例,然后再用一个新的案例考考他:

故事:

一个女人死了,警察在房间发现了很多条这样的字条。

你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\n\n哎,我知道我遇到麻烦了。" 


可以看到o1的思考步骤,每次回答基本都会调用内部的推理流程,一开始就花了15秒:



它的问题太让我吃惊了,每个问题都精准的问到点子上,太吓人了:



随着推理的深入,o1的思考时间会变长,思考的步骤逻辑会发生变化和改进,这次花了23秒:



这里它的推理能力是惊人的,几乎复盘了案件的真相:

凶手是死者的伴侣,而且伪造了字条,

有点东西。



到最后o1完全复盘了案件的经过:



甚至还有更精彩的版本:

推理小说以后是不是可以靠o1写了?

大家赶紧去体验一波!



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询