支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI的ResponseAPI介绍

发布日期:2025-04-11 05:46:52 浏览次数: 1579 作者:深度记事
推荐语

OpenAI最新Agent套件,开启智能代理新时代。

核心内容:
1. 智能客服、DeepResearch等实战应用场景
2. 原子概念Agents、Handoffs、Guardrails等核心机制
3. 循环机制、核心特性等技术细节解析

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

2025是Agent的元年,上周Manus的爆火让大家真实体验了一把什么是Agent,同时也让Anthropic去年就提出的MCP协议再次爆火了一把。本周OpenAI也出了大招,开源了一系列Agent套件。观察下来,感觉这次发布会真正开源了一些可以实战应用的效率工具,同时也开放了两款搜索模型,今天我们详细讲讲这些更新具体为我们带来了哪些有价值的东西~


1、主要功能和受益场景


  • 智能客服:这个应该是最大受益的场景了,距离真实业务场景也最近,知识库问答、呼唤客服、批量下单、取消订单等等可以提供一站式服务;


  • 开源DeepResearch:基于搜索和规划的能力,我们可以快速实现类似openAI-DeepResearch的功能;


  • AIPC和AI手机:CUA工具(Computer Using Agent)借助playwright,可以快速让我们的电脑智能化。当然目前只看到电脑,手机的效果期待更多更新;CUA我们后面专门出一期来讲。


  • 关键核心小工具:

    • 个性化AI护栏:比如家长可以自定义设置禁止使用gpt帮助学生做数学题,来避免孩子偷懒?;

    • 对话的自主路由:自动函数路由、切换会话、基础工具调用等等;


  • 监控工具:目前没有openAI后台权限,这里只能从代码debugging大致观察一下;


2、核心特点


2.1 核心概念


1)原子概念

  • Agents(代理): 配置了指令、工具、Guardrails(护栏)和Handoffs(交接)的大型语言模型(LLMs),是多种功能的集合体。整体可以看做一个装备齐全且易于配置的LLM,具有清晰的指令和内置工具;

  • Handoffs(交接): 允许代理将控制权转移给其他代理以执行特定任务,用于智能体之间的智能控制转移;

  • Guardrails(护栏): 可配置的安全检查机制,用于输入和输出的验证;

  • Tracing(追踪): 内置的代理运行跟踪功能,允许查看、调试和优化工作流程,通过可视化智能体执行轨迹来调试和优化性能;


2)循环机制

当调用 `Runner.run()` 时,AgentSDK会运行一个循环,直到获得最终输出。

  • sdk使用代理(agent)上的模型和设置以及消息历史记录(message history)来调用 LLM(Large Language Model)。  

  • LLM 返回一个响应,该响应可能包含工具调用(tool calls);

  • 如果响应包含最终输出(final output),会返回它并结束循环;

  • 如果响应包含交接(handoff),将代理(agent)设置为新的代理,并回到步骤 1;

  • 处理工具调用(如果有),并将工具响应消息(tool responses messages)附加到消息历史记录中,然后回到步骤 1;

通过 `max_turns` 参数,可以用来限制循环执行的次数;




2.2 核心特性


核心特性可以用一句话概括:一个全新API、三个内置工具,以及一个开源SDK。具体包括:

  • 全新Responses API⁠:将Chat Completions API简单性与Assistants API工具使用功能相结合,用于构建智能体

  • 内置三大工具:网络搜索⁠、文件搜索⁠和计算机使用

  • 全新Agents SDK⁠:用于编排单智能体和多智能体工作流程


图片


3、MCP对比


2024 年 11 月,Anthropic 发布了MCP协议,强调其目标是 打破信息孤岛,解决传统集成中因数据源多样性导致的扩展难题。


用通俗的话讲,MCP就像是专为AI应用设计的通用接口,类似我们日常使用的USB-C。正如USB-C简化了不同设备与计算机的连接方式,MCP简化了AI模型与数据、工具和服务之间的交互方式。通过MCP,AI助手不仅能够「读懂」代码,还能「理解」团队讨论、涉及文档等外部信息,提供更加精准的回答。



具体实现起来并没有那么复杂,形式上跟flask没有特别大的差异:









python的mcp-sdk提供了一个高阶的客户端界面用来连接MCP服务器,下面是一个具体的例子:


总体来看,MCP更多在于提出了一种交互标准,而AgentSDK则更多的给了Agent交互具体的实现,入门程度更低且更偏向于实际应用。如果ResponseAPI更早一点,感觉OWL和OpenManus可能会更优先选择后者了。



4、实际效果演示


4.1 接口的变化

从接口输入来看,与completion接口的主要差别是入参从messages替换成inputs参数,这样可以覆盖更多的属性,例如tools/function都可以作为参数传递进来。





4.2、完整调用链路

我们通过官方给的一个case调用来解析下一次请求具体做了哪些事情。


我们通过守住与openAI最终交互的入口处,来监控AgentSDK的具体动作:

${HomePython}/site-packages/openai/resources/responses/responses.py-1414行,使用pycharm加入一个断点:


1、调用调用栈

整体看起来更像是一个异步消息的分发处理机制,这个整体跟chatgpt出现之前的rasa框架很类似,多线程和协程搭配工作,然后对每一步失败后按照最大重试次数进行重试。


2、路由链路

    通过triage_agent将问题路由到shopping_agent,发生一次handoff交接处理;


3、搜索链路

    shopping_agent调用WebSearchTool联网查询问题;

    

这里的tools参数type=web_search_preview是一个调用联网模型的过程,搜索引擎直接返回结果目前没有直接透出。这里看起来是一个多步的操作,先调用搜索引擎,然后加工处理,最后透出输出结果。貌似没有看到openAI前台页面可以选择不同搜索引擎的参数。



4、后处理链路

    shopping_agent处理返回结果保存成消息输出,下图为变量ouput的最终结果,包括前文介绍的统一结构的item,可以结合代码具体观察一下。


存在的一些问题:

在实际应用的时候,需要考虑到比较多的兜底路由情况,如果不能完整定义调用链路,那么很容易导致模型产生错误的路由。比如上面这个case中,我问的天气,但是最后路由到shop的agent下。如果客户的输入比较随意,可能会导致一些意料之外的事情,会出现比较尴尬的事情。


5、商用案例


开发者可以使用计算机使用工具,来自动化基于浏览器的工作流程,如执行网络应用程序的质量保证或在传统系统中执行数据录入任务。对于那些缺乏API和标准化数据的企业,就可以利用计算机使用工具自动化复杂的运营流程。


在最近与一家主要社区服务组织的试点项目中,Luminai仅用几天时间就实现了申请处理和用户注册流程的自动化——这是传统 RPA(机器人流程自动化)经过数月努力都难以实现的。


Coinbase⁠使用Agents SDK快速开发并部署了 AgentKit,这是一个让AI智能体能够无缝连接加密钱包和各种区块链活动的工具包。Coinbase仅用几小时就将其开发者平台SDK的自定义操作集成到了一个功能完备的智能体中。AgentKit的精简架构简化了添加新智能体操作的流程,让开发者能够更专注于有价值的集成,而不是消耗在复杂的智能体配置上。


未来小编就准备把之前做过的RAG和查询、搜索类工具结合AgentSDK做一个无缝的集成,大大降低代码复杂度。


6、参考

blog-https://openai.com/index/new-tools-for-building-agents/

systemcard-https://openai.com/index/operator-system-card/

api介绍-https://openai.github.io/openai-agents-python/ref/tool/

agents-api-git-https://github.com/openai/openai-agents-python

cua-git-https://github.com/openai/openai-cua-sample-app

openai-cookbook-https://github.com/openai/openai-cookbook/blob/main/examples/responses_api/responses_example.ipynb

套件全解析-https://mp.weixin.qq.com/s/2IOCuuEyYSUi0JEiwTHPtw

发布会介绍-https://mp.weixin.qq.com/s/BwFC7TvT34yo5gt6DsrLMQ

mcp详细介绍-https://mp.weixin.qq.com/s/YRcZTU-uzXNG64fv5HIcwg



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询