我要投稿

OpenAI的全新Agent开发工具，想把Agent生态全抓在自己手里

发布日期：2025-03-13 10:31:40 浏览次数： 1558 来源：硅星人Pro

Agent的热潮还在继续。OpenAI 以“构建Agent的新工具”为标题发布了一系列新的API平台功能，直指下一代AI应用开发标准。

一个特别重要的变化是引入了新的Responses API。全新的Responses API，提供了Agent的构建模块，这些Agent能够帮用户进行搜索、查阅文件并在电脑上执行任务。

OpenAI此前已推出Deep Research和Operator等Agent功能。但不同的行业和应用场景千差万别，企业和开发者需要打造不同的Agent，为此，Responses API通过提供构建模块，帮助开发者来解决这些需求。

Responses API 配备了一个网页搜索工具，使用的是和ChatGPT相同的搜索模型。开发者在使用 GPT-4o和GPT-4o mini时，可以通过这个工具获取实时的网络信息和引用内容。

Responses API还具备Computer Use功能，可以使用OpenAI的Operator模型来能够分析屏幕，代替用户执行任务。此外还提供了一个文档搜索工具，能够快速检索大量文档。OpenAI将其定位为帮助客服人员快速查找常见问题解答，或者帮助律师助理检索历史案例。

对于开发者而言，Responses意味着只需要很少代码就能向AI提出更复杂的问题。比如一些原本需要一百行代码的工作，现在只需三行即可完成。通过 Responses API，开发者还能更清楚地了解模型在做什么——它调用了哪些工具，为何调用它们，以及在调用前后做出了哪些决策。

该API现已面向所有开发者开放，按OpenAI的标准token和工具费率计费。

除了推出Responses API，OpenAI还发布了Agents SDK，一个能够“编排”单个或多个AI Agent工作流程的开源工具。

Responses API是使用模型和工具来完成特定任务的基本单元，而Agents SDK让多个这样的基本单元协同工作，以解决更复杂的任务。

目前有超过三百万开发者在使用OpenAI的API，被开发者广泛使用的是Chat Completions API将类似ChatGPT的功能嵌入到自己的应用中。Responses API和Agents SDK是对OpenAI现有开发者工具的补充。Completions主要涉及文本对话，这次的Responses API可以理解为 Chat Completion API 的升级版。

Responses与基于Chat Completions构建的软件是向后兼容的。OpenAI也将继续支持Completions API。新模型的能力不依赖于内置工具或多次模型调用时，Chat Completions会继续更新，但要想使用那些便捷的工具，需要升级到Responses。OpenAI API团队表示，未来大多数开发者会选择Responses。

即将被淘汰的是Assistants API，这是一个在2023年OpenAI DevDay推出测试版，OpenAI还计划在2026年年中用Responses API取代现有的Assistants API。

API需要预见开发者未来几年可能需要的功能，不难拆解出OpenAI关于未来功能的核心侧重点，新的API极大地扩展了开发者构建Agent的能力，为AI 工程师、AI 设计师、AI 审计员、AI 会计师铺平道路，这些新工具不仅提供了技术便利，更体现了OpenAI的平台战略。

把开发者留在OpenAI上

大模型推理能力的提升，推动了Manus等Agent应用的兴起，这些应用展示了能够完成收集资料分析股票、自动浏览简历并进行有条理的筛选分析等任务。在这次更新的官方博文中，OpenAI也对Agent给出了两个新的定义：我们将Agent视为能够独立为用户完成任务的系统。

另外一个更加具体的定义来自SDK文档：Agent，配备指令和工具的大语言模型。这也暗示了OpenAI实现Agent的方法，Agent本质上是经过特定指令增强并能访问工具的LLM。

在AI市场，OpenAI的Chat Completions API已成为事实上的行业标准，众多公司为了降低开发者切换成本，纷纷提供与之兼容的接口，使其成为AI应用开发的通用基准。

然而竞争并未停歇，随着Agent的崛起，市场竞争格局正在重塑——谷歌和Anthropic等巨头也已进军AI Agent赛道。

Anthropic在2024年11月推出了MCP开放协议，帮助 AI Agent无缝访问工具和数据库，而无需为每个系统编写代码。其核心目标是解决 AI 模型与数据孤岛的隔离问题，通过提供统一协议替代碎片化的自定义集成。MCP使用客户端-服务器架构，AI 应用（如 Claude Desktop 或 IDE）通过 MCP 客户端连接到 MCP 服务器，前者提供数据源或工具的访问。

截至2025年3月，MCP已取得显著进展：10余款工具（包括Claude Desktop、Cursor、Continue）已集成MCP；社区贡献超过1000个MCP服务器，涵盖文件系统、GitHub、Google Drive等领域；微软合作伙伴Block和Apollo已将MCP用于内部系统。Gartner预测到2026年，30%的企业AI项目将采用标准化协议（如MCP）集成外部资源。

MCP的独特之处在于其专注于 AI Agent与外部系统的工具和数据源的调用，而OpenAI Responses API 更侧重集成化开发，直接提供封装完善的功能模块。

对比来看，OpenAI的API是专有解决方案，MCP是开放标准。两者都致力于增强 AI 系统的功能，但它们在实现方式和应用层次上有所不同。使用OpenAI的Agent工具开发，就好像在特定游戏引擎中开发游戏扩展包，功能强大但只能在该生态系统内运行；而MCP则像开放的网络协议，任何遵循这个标准的系统都能互相通信，不论使用什么编程语言或运行在什么平台上。这更像是两家公司在同一行业趋势下的平行发展。

OpenAI通过引入Responses API，简化工具使用、代码执行和状态管理的工作流程，凭借这些功能，OpenAI设想Responses API成为Agent应用的基础，消除了对多个外部集成的需求。

面对来自本土乃至中国竞争对手的竞争，OpenAI需要让开发者持续留在自己平台上构建应用。技术优势不再绝对的OpenAI，似乎已将打造开发者生态系统提升为核心战略重点。

这只是OpenAI全面构建AI Agent平台的第一步，公司表示计划在未来几个月内推出更多工具和集成，以帮助开发者更有效地部署、评估和扩展Agent应用。

十几年前，应用开发需要大量技术投资。随后，苹果和谷歌将其平民化，引爆了数百万应用的市场爆发。如今，这一剧本正在AI领域重演——MCP和Agent SDK等技术正在大幅降低Agent应用的开发门槛，或许类似的爆发即将到来