微信扫码
和创始人交个朋友
我要投稿
Kimi探索版与o1的对比分析,深入探讨搜索和逻辑推理领域的最新进展。 核心内容: 1. Kimi探索版与o1的区别及各自特点 2. 推理模型在搜索任务中的应用及其优势 3. OpenAI对AGI发展的五个阶段解读及其技术路线图
这两天媒体带节奏,把Kimi探索版比作中国的o1。我感觉Kimi探索版主要还是用了手动写逻辑和提示词的“所谓”agent解决方案。有标准的查询拓展、总结等步骤,遵循的是目前AI搜索在后台常见的工作流。但根据推断时间看,Kimi探索版可能对搜索工作流的流程做了一些调整,比如增加网页召回数、加入反思、重搜索等步骤。
虽然有些人认为o1也结合了提示工程,但我更倾向于相信o1的规划推理等都是模型内部自动完成的,输出的回复是单次模型调用的结果。这里指的是主推理模型,最终展示给用户的结果还经过了思考过程摘要、安全对齐等处理。接下来的讨论都基于这一假设。
事实上,人家Kimi探索版是个搜索系统,而o1模型重在逻辑推理,两者没有必要直接比较。但值得思考的是,如果把类o1这种更高级的推理模型应用于搜索,会有什么效果?毕竟,搜索本身是一个涉及多步骤的复杂任务,很适合作为测试模型推理能力的场景。
把o1用于搜索的直接变化是,模型可以自动完成任务分解、选择查询拓展、反思和总结等步骤,替代了手动写逻辑和提示词,可以根据不同情况灵活应对搜索需求。但因为搜索设计多轮反馈,需要结合搜索结果展开后续步骤。搜索过程需要系统层面的多次模型调用和反馈整合。从这一点来看,OpenAI如果想展现自家模型的领先性,坚持只通过模型层解决问题,虽然o1正式版会包含多模态能力,完整的工具调用能力应该不会很快上线。
OpenAI将AGI的发展分成了chatbot、reasoner、agent、innovator和organization五个阶段。o1正处于reasoner第二阶段。按照OpenAI的技术品味,第三阶段应该不是目前依赖手动提示工程的“所谓”agent方式,而是将任务规划和工具调用能力内化到模型中,这意味着模型在调用工具后能够自主处理外部反馈,并基于反馈进行下一步决策。这有点像全双工语音模型,能够同时处理输入和生成:模型在调用工具后会等待外部世界的反馈,然后结合反馈继续下一步的行为。这或许才是理想中的智能代理:不需要预设执行步骤,只需一次调用,模型便可以自主分析、动态规划,并异步执行复杂任务。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-20
如何编写适合自己的 Cursor Rules
2025-02-19
告别链式思考:新一代 AI 推理模型的提示词设计革命
2025-02-19
如何为DeepSeek这类推理模型编写Prompt
2025-02-18
推理框架对比:ReAct、思维链(COT)和思维树(TOT)谁更胜一筹
2025-02-15
DeepSeek提示词工程完全指南:如何用「思维翻译器」激发大模型潜能——附官方提示词和优化案例
2025-02-09
普通人的 GPT 时刻!Deepseek R1 让每个人都学会了麦肯锡式思考
2025-02-09
当AI变“聪明”了,提问的姿势也要变!
2025-02-09
我被DeepSeek干沉默了
2024-08-20
2024-06-29
2023-06-08
2024-09-17
2024-06-27
2024-07-09
2024-07-12
2024-06-14
2024-06-26
2024-09-16
2025-01-05
2025-01-04
2024-12-15
2024-11-15
2024-11-01
2024-10-29
2024-09-11
2024-09-06