我要投稿

OpenAI：就你们也配做智能体？

发布日期：2025-04-23 14:31:05 浏览次数： 1529 作者：AI顿悟涌现时

「

OpenAI吹响市场清洗号角。

」

4月17日，OpenAI发布了全新的推理模型o3和o4-mini。

着实令人意外！因为前天新版本大模型GPT-4.1刚刚发布，业内以为短时间内OpenAI不会再发新模型，此前Altman明确表示过不会再单独发布o3模型，要将其融合进GPT 5一起提供给用户。没想到，这次大料接着一个大料！

这次o3和o4-mini除了在Codeforces、SWE-bench、MMMU等关键基准测试中创造历史频频登顶之外，更值得关注的是，新模式在融合了ChatGPT的联网搜索、python环境、本地搜索、结构化数据等各种功能后，测试分数再次大幅提高，令人眼前一亮。

两款新的推理模型，还首次推出了图像推理，各方网友实测显示，新模型能通过用户随手拍摄的照片，仅靠图片内容分析出图片所处的准确地理位置。

更令人兴奋的是，更小更快更便宜的o4-mini，基准测试数据并不输o3！

价格更是爆炸性！

o4-mini百万token输入价格为1.1美金，输出是4.4美金，缓存命中0.28，比GPT-4.1都便宜！

这真不得不好好感谢DeepSeek，能把OpenAI逼到这种程度！

但另一方面，OpenAI的新模型却实实在在地对现有GenAI大模型创业市场进行了清洗！可以说到了血腥清洗的程度！

GPT-4.1发布，市场还认为其编程能力一般，不足为惧。但o3和o4-mini不仅吞下了编程，而且其模型内能力加上ChatGPT整合服务，直接吞下了通用AI Agent智能体市场。

OpenAI有首屈一指的基础模型技术，又有领先的各种类型强化学习技术，能精确分配智能体服务的哪些部分采用模型内服务，哪些引用外部流程技术。
此次，o3和o4-mini使用自己的python环境，直接解决了大量数学、科学和编程智能体需求。而上周国内知道创宇刚刚发布的AiPy也是这一思维，利用python编程语言强大的软件库生态，搭建大模型专用python use来扩展能力边界。
不过，现在看起来o3和o4-mini已经直接将python大量软件库，内化成模型内服务，不需要在本地大量加载相关库，就能高效完成相关服务。

关于python use和代码解释器的潜力，感兴趣的读者可以点击阅读《国产AiPy把OpenAI雪藏的功能发扬光大，开源本地部署还老电脑可用》。

在此之外，为了更进一步延伸自己的代码能力，OpenAI 直接拿出了一款开源的本地代码智能体：Codex CLI。请注意关键词：开源、本地部署、命令行工具、轻量级！

Codex CLI能在极低的本地资源占用下，帮你完成已有的编程任务！

这也是AiPy的目标，且AiPy当下也是命令行工具的形态存在。以AiPy的体验来看，这一目标已经完成得非常不错，配置极低的老旧电脑都能使用。

猎杀模式已经开启，这还让智能体创业团队怎么活？

实际上，OpenAI已经推出了大量AI Agent智能体服务，且一直都在朝着更简洁完善的开发者服务、更低的本地资源占用、更高效的模型内服务的方向稳步发展。

目前包括ChatGPT tasks、Operator 、Deep Research以及开源的智能体编排框架Agents SDK，实际上更早之前的GPTs也可以视作智能体形态的尝试。

现在看起来，除了Operator的computer use计算机控制功能还有价值，Agents SDK能为企业市场定制本地部署版服务，其他服务在o3和o4-mini面前已经处于淘汰边缘。

AI顿悟涌现时更加期待GPT 5和A-SWE全能编程智能体了。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-23

DeepSeek助力企业变革核心业务？这8个案例太经典了

2025-04-23

万字解读AI落地本质：To B才是AI主战场

2025-04-23

一家小VC眼中的：AI投资指北

2025-04-23

揭秘Manus：了解其背后的原理与架构

2025-04-23

周飞：能源电力大模型的研发路径与应用模式探讨

2025-04-23

AI 能陪你亲亲热热，多亏了“存储硬汉”输出狠活儿！

2025-04-23

AI Agent 的下半场：从token生成到自主体验

2025-04-23

突发！OpenAI 收购谷歌 Chrome 浏览器，AI与搜索领域或掀风暴！

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

从“大模型热”到“Agent 潮”，“真风口”还是“伪命题”？

2025-04-21

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部