微信扫码
与创始人交个朋友
我要投稿
几乎是毫无预兆,
OpenAI发布OpenAI o1模型,也就是之前所谓的草莓Q模型,它的能力比4o提升了一大截:
o1是一个通过强化学习训练的大型语言模型,分为两个模型,o1预览版和o1 mini,o1 mini版是一个高效、紧凑且经济的模型,推理能力强但普通知识比较弱。
o1预览版每周30条,o1-mini每周50条。
o1显著的特点是具备"思考链"(Chain of Thought)能力。
分解复杂问题:o1能够将一个复杂的问题分解为多个子步骤,然后逐步解决。
自我纠错:在推理过程中,o1能够识别并纠正自己的错误,这大大提高了最终结果的准确性。
尝试多种方法:当一种方法不奏效时,o1能够尝试不同的解题策略,这种灵活性使其能够处理各种各样的问题。
透明的推理过程:o1能够清晰地展示其推理过程,这不仅提高了结果的可解释性,也为进一步改进模型提供了宝贵的洞察。
目前我的Plus账号已经推送了o1-mini和o1-preview的模型。
其他资讯都大同小异,
下面我用著名的海龟汤问题来测试下模型的能力。
接来下我喂给o1几个案例,然后再用一个新的案例考考他:
故事:
一个女人死了,警察在房间发现了很多条这样的字条。
你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\n\n哎,我知道我遇到麻烦了。"
可以看到o1的思考步骤,每次回答基本都会调用内部的推理流程,一开始就花了15秒:
它的问题太让我吃惊了,每个问题都精准的问到点子上,太吓人了:
随着推理的深入,o1的思考时间会变长,思考的步骤逻辑会发生变化和改进,这次花了23秒:
这里它的推理能力是惊人的,几乎复盘了案件的真相:
凶手是死者的伴侣,而且伪造了字条,
有点东西。
到最后o1完全复盘了案件的经过:
甚至还有更精彩的版本:
推理小说以后是不是可以靠o1写了?
大家赶紧去体验一波!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-06
86 条 DeepSeek 的关键思考 |Best Ideas 开源
2025-02-06
GitCode 重磅上线 DeepSeek 全家桶!领航国产大模型新征程
2025-02-06
Dify x DeepSeek:轻松部署私有化 AI 助手,搭建本地 DeepSeek R1+ 联网搜索 App
2025-02-06
等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开
2025-02-06
Open Notebook:开源AI笔记工具,支持多模型与多格式内容集成
2025-02-05
一文纵览DeepSeek模型家族:从LLM到R1
2025-02-05
抱抱脸24小时复刻Deep Research,一个团队完成一个OpenAI~
2025-02-05
从0-1:DeepSeek 大模型本地部署全攻略
2025-01-01
2024-07-25
2024-05-06
2025-01-21
2024-08-13
2024-06-12
2024-09-20
2024-07-11
2024-07-20
2024-12-26
2025-01-22
2025-01-16
2024-12-24
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13