我要投稿

o1背后，Agent逻辑！

发布日期：2025-01-22 19:50:28 浏览次数： 1780 作者：探索AGI

这几天，关于 OpenAI 的 o1 模型文章刷屏了，连 OpenAI 的大佬 Sam Altman 和 Greg Brockman 都纷纷点赞。这篇文章直言不讳地说：“o1根本不是聊天模型！” 这句话，就像一记重锤，敲醒了很多把它当“升级版GPT”的人。

“什么？我花钱订阅的 o1，竟然不是用来聊天的？那它到底是啥？”

故事的开端，是一位名叫 Ben Hylak 的前苹果和 SpaceX 工程师，他怒斥 o1 模型“太垃圾了”，输出的内容自相矛盾，简直是“胡言乱语”。但随着他与更多人的交流，他发现自己错了—— 不是 o1 不行，而是我们用错了方法！

甚至Altman也出来留言了，表示看到这个转变，真有意思~

原来，o1 的定位根本不是聊天机器人，而是一个“报告生成器”。它需要你像对待一个新入职的员工一样，给它足够的背景信息和期望，它就能给你一份高质量的结果报告。

打破传统：给o1提问的正确姿势

1. “海量”的上下文，别吝啬！

如果你用过 GPT-4o 或其他聊天模型，你可能习惯了“边聊边补充信息”。但 o1 不吃这一套，它不会主动问你细节。你需要一次性把所有相关信息都“喂”给它，就像给它“投喂”十倍于你平时提示语的上下文！

举个例子，你问一个简单的工程问题，别只抛出问题，你需要：

详细描述所有你尝试过但没奏效的方法；
贴上所有数据库架构的完整dump；
解释你公司的业务、规模，以及任何公司特有的术语。

记住，要把它当成一个刚入职的新人，你需要事无巨细地交代清楚。

2. 聚焦目标，别教它做事！

给足上下文后，你需要明确告诉 o1 你想要什么，而不是告诉它怎么做。以前你可能会说：“你是一个专家，请慢思考并仔细推理。” 但现在，你直接说：“给我一个XXXX清单。” o1 自带推理能力，你只需要告诉它目标，剩下的交给它！

o1 的“拿手好戏”和“短板”

o1 擅长：

一次性处理多个文件： 给它一大堆代码和上下文，它能一次性搞定，而且基本不出错。
减少“幻觉”： 在处理特定领域的查询，比如 ClickHouse 或 New Relic 时，它比其他模型更靠谱。
辅助医疗诊断： 它可以根据照片和描述，给出相当准确的皮肤问题鉴别诊断。
概念解释： 它能用清晰的例子解释复杂的工程概念。
架构决策： 它可以生成多个方案，并比较优缺点。
结果评估： 它可以判断生成结果是否正确。

o1 不擅长：

特定风格写作： 它的文风偏学术报告，很难模仿特定风格。
构建完整应用： 它适合处理单个文件或模块，但无法从零构建整个 SaaS 应用。

延迟：可能带来“大惊喜”

o1 的另一个特点是“慢”。聊天模型可以秒出结果，但 o1 需要几分钟甚至更长时间。但这或许不是缺点，而是一种机遇。

正如 Ben Hylak 所说：“延迟会从根本上改变产品体验。” 就像电子邮件和短信的区别一样，它可能会催生出那些需要长时间后台推理的应用。

用户愿意为哪些任务等待 5 分钟？1小时？一天？ 答案可能会颠覆我们对AI的认知！

最后

是不是在o1的身上看到了Agent的影子？也许，我们正在见证一个全新的 AI 交互范式：不再是实时的对话，而是更长周期、更复杂的任务执行。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-25

DeepSeek + Dify 企业级大模型私有化部署指南

2025-04-24

自主构建MCP，轻松实现云端部署！

2025-04-24

大模型微调框架LLaMA-Factory

2025-04-23

Unsloth：提升 LLM 微调效率的革命性开源工具

2025-04-23

超越 DevOps？VibeOps 引领 AI 驱动的开发革命

2025-04-23

大模型想 “专精” 特定任务？这 3 种 Addition-Based 微调法别错过

2025-04-23

重参数化微调：揭秘LoRA家族让大模型训练成本暴降的方法

2025-04-23

为什么全参数微调能让大模型从“通才”变“专才”？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

一文读懂DeepSeek-R1本地部署配置要求（建议收藏）

2025-02-04

DeepSeek R1 671B 完整版本地部署教程来了！！！

2025-02-04

太爽了！o1 现在可以天天享用了

2024-09-18

万字综述 10+ 种 LLM 投机采样推理加速方案

2024-07-11

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-07-09

FP8 低精度训练：Transformer Engine 简析

2024-07-11

彻底理解系列之：FP32、FP16、TF32、BF16、混合精度

2024-07-26

别被Deepseek低成本冲昏头！本地化部署后续的“甜蜜陷阱”，你真能扛住吗？

2025-02-05

ollama 部署 deepseek-r1 70B 模型完整指南

2025-01-27

o3-mini 完全指南：一个被 DeepSeek 破大防的模型

2025-02-01

大家都在问

为什么全参数微调能让大模型从“通才”变“专才”？

2025-04-23

MCP vs Function Calling，该如何选？

2025-04-20

RAGFlow vs Dify, 商业化落地场景选哪个？

2025-04-01

如何利用Dify轻松构建你的专属语料库？

2025-03-31

从 0 到 1，Agentic Ops 如何打造企业级 AI 生产力？

2025-03-20

DeepSeek-R1的Qwen-32B蒸馏模型与QwQ-32B模型，谁更强？

2025-03-16

部署DeepSeek的4条路，企业级客户到底该咋走？

2025-03-16

谷歌Gemma 3 27b 到底能不能打，写个游戏测试下？

2025-03-13

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB