微信扫码
添加专属顾问
我要投稿
OpenAI 的 o1 模型引发热议,颠覆传统认知,探索其背后的 Agent 逻辑! 核心内容: 1. o1 模型不是聊天机器人而是报告生成器 2. 给 o1 提问的正确姿势,如提供海量上下文 3. 明确告知 o1 目标,不教它做事
这几天,关于 OpenAI 的 o1 模型文章刷屏了,连 OpenAI 的大佬 Sam Altman 和 Greg Brockman 都纷纷点赞。这篇文章直言不讳地说:“o1根本不是聊天模型!” 这句话,就像一记重锤,敲醒了很多把它当“升级版GPT”的人。
“什么?我花钱订阅的 o1,竟然不是用来聊天的?那它到底是啥?”
故事的开端,是一位名叫 Ben Hylak 的前苹果和 SpaceX 工程师,他怒斥 o1 模型“太垃圾了”,输出的内容自相矛盾,简直是“胡言乱语”。但随着他与更多人的交流,他发现自己错了—— 不是 o1 不行,而是我们用错了方法!
甚至Altman也出来留言了,表示看到这个转变,真有意思~
原来,o1 的定位根本不是聊天机器人,而是一个“报告生成器”。它需要你像对待一个新入职的员工一样,给它足够的背景信息和期望,它就能给你一份高质量的结果报告。
1. “海量”的上下文,别吝啬!
如果你用过 GPT-4o 或其他聊天模型,你可能习惯了“边聊边补充信息”。但 o1 不吃这一套,它不会主动问你细节。你需要一次性把所有相关信息都“喂”给它,就像给它“投喂”十倍于你平时提示语的上下文!
举个例子,你问一个简单的工程问题,别只抛出问题,你需要:
记住,要把它当成一个刚入职的新人,你需要事无巨细地交代清楚。
2. 聚焦目标,别教它做事!
给足上下文后,你需要明确告诉 o1 你想要什么,而不是告诉它怎么做。以前你可能会说:“你是一个专家,请慢思考并仔细推理。” 但现在,你直接说:“给我一个XXXX清单。” o1 自带推理能力,你只需要告诉它目标,剩下的交给它!
o1 擅长:
o1 不擅长:
o1 的另一个特点是“慢”。聊天模型可以秒出结果,但 o1 需要几分钟甚至更长时间。但这或许不是缺点,而是一种机遇。
正如 Ben Hylak 所说:“延迟会从根本上改变产品体验。” 就像电子邮件和短信的区别一样,它可能会催生出那些需要长时间后台推理的应用。
用户愿意为哪些任务等待 5 分钟?1小时?一天? 答案可能会颠覆我们对AI的认知!
是不是在o1的身上看到了Agent的影子?也许,我们正在见证一个全新的 AI 交互范式:不再是实时的对话,而是更长周期、更复杂的任务执行。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-25
DeepSeek + Dify 企业级大模型私有化部署指南
2025-04-24
自主构建MCP,轻松实现云端部署!
2025-04-24
大模型微调框架LLaMA-Factory
2025-04-23
Unsloth:提升 LLM 微调效率的革命性开源工具
2025-04-23
超越 DevOps?VibeOps 引领 AI 驱动的开发革命
2025-04-23
大模型想 “专精” 特定任务?这 3 种 Addition-Based 微调法别错过
2025-04-23
重参数化微调:揭秘LoRA家族让大模型训练成本暴降的方法
2025-04-23
为什么全参数微调能让大模型从“通才”变“专才”?
2025-02-04
2025-02-04
2024-09-18
2024-07-11
2024-07-09
2024-07-11
2024-07-26
2025-02-05
2025-01-27
2025-02-01
2025-04-23
2025-04-20
2025-04-01
2025-03-31
2025-03-20
2025-03-16
2025-03-16
2025-03-13