AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI的全新Agent开发工具,想把Agent生态全抓在自己手里

发布日期:2025-03-13 10:31:40 浏览次数: 1558 来源:硅星人Pro
推荐语

OpenAI发布全新Agent开发工具,引领下一代AI应用开发新标准。

核心内容:
1. OpenAI推出Responses API,构建Agent的新工具
2. Responses API提供网页搜索、计算机使用、文档搜索等功能
3. 开发者利用Responses API大幅降低开发代码量,提升开发效率

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

Agent的热潮还在继续。OpenAI 以“构建Agent的新工具”为标题发布了一系列新的API平台功能,直指下一代AI应用开发标准。

一个特别重要的变化是引入了新的Responses API。全新的Responses API,提供了Agent的构建模块,这些Agent能够帮用户进行搜索、查阅文件并在电脑上执行任务。

OpenAI此前已推出Deep Research和Operator等Agent功能。但不同的行业和应用场景千差万别,企业和开发者需要打造不同的Agent,为此,Responses API通过提供构建模块,帮助开发者来解决这些需求。

Responses API 配备了一个网页搜索工具,使用的是和ChatGPT相同的搜索模型。开发者在使用 GPT-4o和GPT-4o mini时,可以通过这个工具获取实时的网络信息和引用内容。

Responses API还具备Computer Use功能,可以使用OpenAI的Operator模型来能够分析屏幕,代替用户执行任务。此外还提供了一个文档搜索工具,能够快速检索大量文档。OpenAI将其定位为帮助客服人员快速查找常见问题解答,或者帮助律师助理检索历史案例。

对于开发者而言,Responses意味着只需要很少代码就能向AI提出更复杂的问题。比如一些原本需要一百行代码的工作,现在只需三行即可完成。通过 Responses API,开发者还能更清楚地了解模型在做什么——它调用了哪些工具,为何调用它们,以及在调用前后做出了哪些决策。

该API现已面向所有开发者开放,按OpenAI的标准token和工具费率计费。

除了推出Responses API,OpenAI还发布了Agents SDK,一个能够“编排”单个或多个AI Agent工作流程的开源工具。

Responses API是使用模型和工具来完成特定任务的基本单元,而Agents SDK让多个这样的基本单元协同工作,以解决更复杂的任务。

目前有超过三百万开发者在使用OpenAI的API,被开发者广泛使用的是Chat Completions API将类似ChatGPT的功能嵌入到自己的应用中。Responses API和Agents SDK是对OpenAI现有开发者工具的补充。Completions主要涉及文本对话,这次的Responses API可以理解为 Chat Completion API 的升级版。

Responses与基于Chat Completions构建的软件是向后兼容的。OpenAI也将继续支持Completions API。新模型的能力不依赖于内置工具或多次模型调用时,Chat Completions会继续更新,但要想使用那些便捷的工具,需要升级到Responses。OpenAI API团队表示,未来大多数开发者会选择Responses。

即将被淘汰的是Assistants API,这是一个在2023年OpenAI DevDay推出测试版,OpenAI还计划在2026年年中用Responses API取代现有的Assistants API。

API需要预见开发者未来几年可能需要的功能,不难拆解出OpenAI关于未来功能的核心侧重点,新的API极大地扩展了开发者构建Agent的能力,为AI 工程师、AI 设计师、AI 审计员、AI 会计师铺平道路,这些新工具不仅提供了技术便利,更体现了OpenAI的平台战略。

1

把开发者留在OpenAI上

大模型推理能力的提升,推动了Manus等Agent应用的兴起,这些应用展示了能够完成收集资料分析股票、自动浏览简历并进行有条理的筛选分析等任务。在这次更新的官方博文中,OpenAI也对Agent给出了两个新的定义:我们将Agent视为能够独立为用户完成任务的系统。

另外一个更加具体的定义来自SDK文档:Agent,配备指令和工具的大语言模型。这也暗示了OpenAI实现Agent的方法,Agent本质上是经过特定指令增强并能访问工具的LLM。

在AI市场,OpenAI的Chat Completions API已成为事实上的行业标准,众多公司为了降低开发者切换成本,纷纷提供与之兼容的接口,使其成为AI应用开发的通用基准。

然而竞争并未停歇,随着Agent的崛起,市场竞争格局正在重塑——谷歌和Anthropic等巨头也已进军AI Agent赛道。

Anthropic在2024年11月推出了MCP开放协议,帮助 AI Agent无缝访问工具和数据库,而无需为每个系统编写代码。其核心目标是解决 AI 模型与数据孤岛的隔离问题,通过提供统一协议替代碎片化的自定义集成。MCP使用客户端-服务器架构,AI 应用(如 Claude Desktop 或 IDE)通过 MCP 客户端连接到 MCP 服务器,前者提供数据源或工具的访问。

截至2025年3月,MCP已取得显著进展:10余款工具(包括Claude Desktop、Cursor、Continue)已集成MCP;社区贡献超过1000个MCP服务器,涵盖文件系统、GitHub、Google Drive等领域;微软合作伙伴Block和Apollo已将MCP用于内部系统。Gartner预测到2026年,30%的企业AI项目将采用标准化协议(如MCP)集成外部资源。

MCP的独特之处在于其专注于 AI Agent与外部系统的工具和数据源的调用,而OpenAI Responses API 更侧重集成化开发,直接提供封装完善的功能模块。

对比来看,OpenAI的API是专有解决方案,MCP是开放标准。两者都致力于增强 AI 系统的功能,但它们在实现方式和应用层次上有所不同。使用OpenAI的Agent工具开发,就好像在特定游戏引擎中开发游戏扩展包 ,功能强大但只能在该生态系统内运行;而MCP则像开放的网络协议,任何遵循这个标准的系统都能互相通信,不论使用什么编程语言或运行在什么平台上。这更像是两家公司在同一行业趋势下的平行发展。

OpenAI通过引入Responses API,简化工具使用、代码执行和状态管理的工作流程,凭借这些功能,OpenAI设想Responses API成为Agent应用的基础,消除了对多个外部集成的需求。

面对来自本土乃至中国竞争对手的竞争,OpenAI需要让开发者持续留在自己平台上构建应用。技术优势不再绝对的OpenAI,似乎已将打造开发者生态系统提升为核心战略重点。

这只是OpenAI全面构建AI Agent平台的第一步,公司表示计划在未来几个月内推出更多工具和集成,以帮助开发者更有效地部署、评估和扩展Agent应用。

十几年前,应用开发需要大量技术投资。随后,苹果和谷歌将其平民化,引爆了数百万应用的市场爆发。如今,这一剧本正在AI领域重演——MCP和Agent SDK等技术正在大幅降低Agent应用的开发门槛,或许类似的爆发即将到来


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询