微信扫码
添加专属顾问
我要投稿
OpenAI最新Agent套件,开启智能代理新时代。核心内容:1. 智能客服、DeepResearch等实战应用场景2. 原子概念Agents、Handoffs、Guardrails等核心机制3. 循环机制、核心特性等技术细节解析
2025是Agent的元年,上周Manus的爆火让大家真实体验了一把什么是Agent,同时也让Anthropic去年就提出的MCP协议再次爆火了一把。本周OpenAI也出了大招,开源了一系列Agent套件。观察下来,感觉这次发布会真正开源了一些可以实战应用的效率工具,同时也开放了两款搜索模型,今天我们详细讲讲这些更新具体为我们带来了哪些有价值的东西~
1、主要功能和受益场景
智能客服:这个应该是最大受益的场景了,距离真实业务场景也最近,知识库问答、呼唤客服、批量下单、取消订单等等可以提供一站式服务;
开源DeepResearch:基于搜索和规划的能力,我们可以快速实现类似openAI-DeepResearch的功能;
AIPC和AI手机:CUA工具(Computer Using Agent)借助playwright,可以快速让我们的电脑智能化。当然目前只看到电脑,手机的效果期待更多更新;CUA我们后面专门出一期来讲。
关键核心小工具:
个性化AI护栏:比如家长可以自定义设置禁止使用gpt帮助学生做数学题,来避免孩子偷懒?;
对话的自主路由:自动函数路由、切换会话、基础工具调用等等;
监控工具:目前没有openAI后台权限,这里只能从代码debugging大致观察一下;
2、核心特点
2.1 核心概念
1)原子概念
Agents(代理): 配置了指令、工具、Guardrails(护栏)和Handoffs(交接)的大型语言模型(LLMs),是多种功能的集合体。整体可以看做一个装备齐全且易于配置的LLM,具有清晰的指令和内置工具;
Handoffs(交接): 允许代理将控制权转移给其他代理以执行特定任务,用于智能体之间的智能控制转移;
Guardrails(护栏): 可配置的安全检查机制,用于输入和输出的验证;
Tracing(追踪): 内置的代理运行跟踪功能,允许查看、调试和优化工作流程,通过可视化智能体执行轨迹来调试和优化性能;
2)循环机制
当调用 `Runner.run()` 时,AgentSDK会运行一个循环,直到获得最终输出。
sdk使用代理(agent)上的模型和设置以及消息历史记录(message history)来调用 LLM(Large Language Model)。
LLM 返回一个响应,该响应可能包含工具调用(tool calls);
如果响应包含最终输出(final output),会返回它并结束循环;
如果响应包含交接(handoff),将代理(agent)设置为新的代理,并回到步骤 1;
处理工具调用(如果有),并将工具响应消息(tool responses messages)附加到消息历史记录中,然后回到步骤 1;
通过 `max_turns` 参数,可以用来限制循环执行的次数;
2.2 核心特性
核心特性可以用一句话概括:一个全新API、三个内置工具,以及一个开源SDK。具体包括:
全新Responses API:将Chat Completions API简单性与Assistants API工具使用功能相结合,用于构建智能体
内置三大工具:网络搜索、文件搜索和计算机使用
全新Agents SDK:用于编排单智能体和多智能体工作流程
3、MCP对比
2024 年 11 月,Anthropic 发布了MCP协议,强调其目标是 打破信息孤岛,解决传统集成中因数据源多样性导致的扩展难题。
用通俗的话讲,MCP就像是专为AI应用设计的通用接口,类似我们日常使用的USB-C。正如USB-C简化了不同设备与计算机的连接方式,MCP简化了AI模型与数据、工具和服务之间的交互方式。通过MCP,AI助手不仅能够「读懂」代码,还能「理解」团队讨论、涉及文档等外部信息,提供更加精准的回答。
具体实现起来并没有那么复杂,形式上跟flask没有特别大的差异:
python的mcp-sdk提供了一个高阶的客户端界面用来连接MCP服务器,下面是一个具体的例子:
总体来看,MCP更多在于提出了一种交互标准,而AgentSDK则更多的给了Agent交互具体的实现,入门程度更低且更偏向于实际应用。如果ResponseAPI更早一点,感觉OWL和OpenManus可能会更优先选择后者了。
4、实际效果演示
4.1 接口的变化
从接口输入来看,与completion接口的主要差别是入参从messages替换成inputs参数,这样可以覆盖更多的属性,例如tools/function都可以作为参数传递进来。
4.2、完整调用链路
我们通过官方给的一个case调用来解析下一次请求具体做了哪些事情。
我们通过守住与openAI最终交互的入口处,来监控AgentSDK的具体动作:
${HomePython}/site-packages/openai/resources/responses/responses.py-1414行,使用pycharm加入一个断点:
1、调用调用栈
整体看起来更像是一个异步消息的分发处理机制,这个整体跟chatgpt出现之前的rasa框架很类似,多线程和协程搭配工作,然后对每一步失败后按照最大重试次数进行重试。
2、路由链路
通过triage_agent将问题路由到shopping_agent,发生一次handoff交接处理;
3、搜索链路
shopping_agent调用WebSearchTool联网查询问题;
这里的tools参数type=web_search_preview是一个调用联网模型的过程,搜索引擎直接返回结果目前没有直接透出。这里看起来是一个多步的操作,先调用搜索引擎,然后加工处理,最后透出输出结果。貌似没有看到openAI前台页面可以选择不同搜索引擎的参数。
4、后处理链路
shopping_agent处理返回结果保存成消息输出,下图为变量ouput的最终结果,包括前文介绍的统一结构的item,可以结合代码具体观察一下。
存在的一些问题:
在实际应用的时候,需要考虑到比较多的兜底路由情况,如果不能完整定义调用链路,那么很容易导致模型产生错误的路由。比如上面这个case中,我问的天气,但是最后路由到shop的agent下。如果客户的输入比较随意,可能会导致一些意料之外的事情,会出现比较尴尬的事情。
5、商用案例
开发者可以使用计算机使用工具,来自动化基于浏览器的工作流程,如执行网络应用程序的质量保证或在传统系统中执行数据录入任务。对于那些缺乏API和标准化数据的企业,就可以利用计算机使用工具自动化复杂的运营流程。
在最近与一家主要社区服务组织的试点项目中,Luminai仅用几天时间就实现了申请处理和用户注册流程的自动化——这是传统 RPA(机器人流程自动化)经过数月努力都难以实现的。
Coinbase使用Agents SDK快速开发并部署了 AgentKit,这是一个让AI智能体能够无缝连接加密钱包和各种区块链活动的工具包。Coinbase仅用几小时就将其开发者平台SDK的自定义操作集成到了一个功能完备的智能体中。AgentKit的精简架构简化了添加新智能体操作的流程,让开发者能够更专注于有价值的集成,而不是消耗在复杂的智能体配置上。
未来小编就准备把之前做过的RAG和查询、搜索类工具结合AgentSDK做一个无缝的集成,大大降低代码复杂度。
6、参考
blog-https://openai.com/index/new-tools-for-building-agents/
systemcard-https://openai.com/index/operator-system-card/
api介绍-https://openai.github.io/openai-agents-python/ref/tool/
agents-api-git-https://github.com/openai/openai-agents-python
cua-git-https://github.com/openai/openai-cua-sample-app
openai-cookbook-https://github.com/openai/openai-cookbook/blob/main/examples/responses_api/responses_example.ipynb
套件全解析-https://mp.weixin.qq.com/s/2IOCuuEyYSUi0JEiwTHPtw
发布会介绍-https://mp.weixin.qq.com/s/BwFC7TvT34yo5gt6DsrLMQ
mcp详细介绍-https://mp.weixin.qq.com/s/YRcZTU-uzXNG64fv5HIcwg
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-13
永别了,GPT-4!
2025-04-13
GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹
2025-04-13
MCP、Function Calling 有什么区别?与 AI Agent 有什么关系?
2025-04-13
AI浏览代理崛起:OpenAI重磅发布新基准,揭示AI智能搜索挑战
2025-04-13
谷歌 AI Agent-to-Agent 让AI像人类一样交流协作
2025-04-13
Google Deep Research VS Manus:关公战赵四
2025-04-13
有了MCP,还需要深入研究Agent吗?
2025-04-13
【阿里云百炼推出MCP市场】高德地图MCP + Qwen Max构建AI应用,找公共厕所变得如此轻松
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17