AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


o1背后,Agent逻辑!
发布日期:2025-01-22 19:50:28 浏览次数: 1518 来源:探索AGI
推荐语

OpenAI 的 o1 模型引发热议,颠覆传统认知,探索其背后的 Agent 逻辑!

核心内容:
1. o1 模型不是聊天机器人而是报告生成器
2. 给 o1 提问的正确姿势,如提供海量上下文
3. 明确告知 o1 目标,不教它做事

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

嘿,大家好!这里是一个专注于AI智能体的频道~

这几天,关于 OpenAI 的 o1 模型文章刷屏了,连 OpenAI 的大佬 Sam Altman 和 Greg Brockman 都纷纷点赞。这篇文章直言不讳地说:“o1根本不是聊天模型!” 这句话,就像一记重锤,敲醒了很多把它当“升级版GPT”的人。

“什么?我花钱订阅的 o1,竟然不是用来聊天的?那它到底是啥?”

故事的开端,是一位名叫 Ben Hylak 的前苹果和 SpaceX 工程师,他怒斥 o1 模型“太垃圾了”,输出的内容自相矛盾,简直是“胡言乱语”。但随着他与更多人的交流,他发现自己错了—— 不是 o1 不行,而是我们用错了方法!

甚至Altman也出来留言了,表示看到这个转变,真有意思~

原来,o1 的定位根本不是聊天机器人,而是一个“报告生成器”。它需要你像对待一个新入职的员工一样,给它足够的背景信息和期望,它就能给你一份高质量的结果报告。

打破传统:给o1提问的正确姿势

1. “海量”的上下文,别吝啬!

如果你用过 GPT-4o 或其他聊天模型,你可能习惯了“边聊边补充信息”。但 o1 不吃这一套,它不会主动问你细节。你需要一次性把所有相关信息都“喂”给它,就像给它“投喂”十倍于你平时提示语的上下文!

举个例子,你问一个简单的工程问题,别只抛出问题,你需要:

  • 详细描述所有你尝试过但没奏效的方法;
  • 贴上所有数据库架构的完整dump;
  • 解释你公司的业务、规模,以及任何公司特有的术语。

记住,要把它当成一个刚入职的新人,你需要事无巨细地交代清楚。

2. 聚焦目标,别教它做事!

给足上下文后,你需要明确告诉 o1 你想要什么,而不是告诉它怎么做。以前你可能会说:“你是一个专家,请慢思考并仔细推理。” 但现在,你直接说:“给我一个XXXX清单。” o1 自带推理能力,你只需要告诉它目标,剩下的交给它!

o1 的“拿手好戏”和“短板”

o1 擅长:

  • 一次性处理多个文件: 给它一大堆代码和上下文,它能一次性搞定,而且基本不出错。
  • 减少“幻觉”: 在处理特定领域的查询,比如 ClickHouse 或 New Relic 时,它比其他模型更靠谱。
  • 辅助医疗诊断: 它可以根据照片和描述,给出相当准确的皮肤问题鉴别诊断。
  • 概念解释: 它能用清晰的例子解释复杂的工程概念。
  • 架构决策: 它可以生成多个方案,并比较优缺点。
  • 结果评估: 它可以判断生成结果是否正确。

o1 不擅长:

  • 特定风格写作: 它的文风偏学术报告,很难模仿特定风格。
  • 构建完整应用: 它适合处理单个文件或模块,但无法从零构建整个 SaaS 应用。

延迟:可能带来“大惊喜”

o1 的另一个特点是“慢”。聊天模型可以秒出结果,但 o1 需要几分钟甚至更长时间。但这或许不是缺点,而是一种机遇。

正如 Ben Hylak 所说:“延迟会从根本上改变产品体验。”  就像电子邮件和短信的区别一样,它可能会催生出那些需要长时间后台推理的应用。

用户愿意为哪些任务等待 5 分钟?1小时?一天? 答案可能会颠覆我们对AI的认知!

最后

是不是在o1的身上看到了Agent的影子?也许,我们正在见证一个全新的 AI 交互范式:不再是实时的对话,而是更长周期、更复杂的任务执行。

好了,这就是我今天想分享的内容。如果你对构建AI智能体感兴趣,别忘了点赞、关注噢~




53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询