微信扫码
与创始人交个朋友
我要投稿
几乎是毫无预兆,
OpenAI发布OpenAI o1模型,也就是之前所谓的草莓Q模型,它的能力比4o提升了一大截:
o1是一个通过强化学习训练的大型语言模型,分为两个模型,o1预览版和o1 mini,o1 mini版是一个高效、紧凑且经济的模型,推理能力强但普通知识比较弱。
o1预览版每周30条,o1-mini每周50条。
o1显著的特点是具备"思考链"(Chain of Thought)能力。
分解复杂问题:o1能够将一个复杂的问题分解为多个子步骤,然后逐步解决。
自我纠错:在推理过程中,o1能够识别并纠正自己的错误,这大大提高了最终结果的准确性。
尝试多种方法:当一种方法不奏效时,o1能够尝试不同的解题策略,这种灵活性使其能够处理各种各样的问题。
透明的推理过程:o1能够清晰地展示其推理过程,这不仅提高了结果的可解释性,也为进一步改进模型提供了宝贵的洞察。
目前我的Plus账号已经推送了o1-mini和o1-preview的模型。
其他资讯都大同小异,
下面我用著名的海龟汤问题来测试下模型的能力。
接来下我喂给o1几个案例,然后再用一个新的案例考考他:
故事:
一个女人死了,警察在房间发现了很多条这样的字条。
你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\n\n哎,我知道我遇到麻烦了。"
可以看到o1的思考步骤,每次回答基本都会调用内部的推理流程,一开始就花了15秒:
它的问题太让我吃惊了,每个问题都精准的问到点子上,太吓人了:
随着推理的深入,o1的思考时间会变长,思考的步骤逻辑会发生变化和改进,这次花了23秒:
这里它的推理能力是惊人的,几乎复盘了案件的真相:
凶手是死者的伴侣,而且伪造了字条,
有点东西。
到最后o1完全复盘了案件的经过:
甚至还有更精彩的版本:
推理小说以后是不是可以靠o1写了?
大家赶紧去体验一波!
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-22
花60元,DIY了一个AI机器人,能聊天,会认人……
2024-12-21
基于AI智能助理的软件开源组件安全检查
2024-12-21
Llama2024年度要点总结
2024-12-21
重磅! Github Copilot 免费了
2024-12-20
万字长文帮你搞定AI Agent选型
2024-12-20
微软开源的 Markitdown 可将任意文件转换为 Markdown 格式,PDF 解析咋样?
2024-12-20
Claude的MCP(模型上下文协议)简介
2024-12-20
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
2024-05-06
2024-07-25
2024-08-13
2024-06-12
2024-07-11
2024-06-16
2024-07-20
2024-09-20
2024-06-15
2024-07-25
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13
2024-11-13
2024-10-07
2024-09-22