我要投稿

Azure AI Foundry 发布 Responses API 与计算机操作智能体（CUA）

发布日期：2025-03-24 18:10:30 浏览次数： 1598 作者：Azure云科技

AI 智能体正在重塑各行各业，推动自动化变革、提升生产力、赋能智能决策。企业已广泛应用 AI 智能体来处理保险理赔、IT 服务管理、优化供应链物流，甚至辅助医生分析医疗记录，智能技术的潜力正在不断拓展。近期，Azure AI Foundry 正式推出两项重磅创新：

Responses API：一款强大的 API，可帮助 AI 应用高效获取信息、处理数据并执行操作，让智能决策更加流畅。
计算机操作智能体（CUA）：一款突破性的 AI 模型，能够自主操作软件界面、执行任务、自动化处理工作流。

这两项创新将帮助企业进一步解锁 AI 技术潜能，让 AI 不只是助手，更成为企业的虚拟劳动力，从而推动大规模自动化，提升效率，加速智能化升级。

Responses API：

让 AI 智能体开发更简单、更强大

在 Azure AI Foundry 中，Responses API 是打造“智能型 AI”的关键，为企业带来更强的智能生产力。它不仅是 Azure OpenAI 服务（国际版）内置工具的新基石，还融合了 Chat Completions API 的简洁性、Assistants API 和 Azure AI Agent Service 的高级能力，让企业可以更轻松地将 AI 技术赋能到业务流程中。

借助 Responses API：

✅ 只需调用一次即可实现与 CUA、函数执行、文件搜索等工具无缝交互，实现更智能的任务自动化。

✅ 数据检索、信息处理、执行任务，现实与多工作流无缝衔接。

Responses API

如何助力 AI 智能体？

Responses API 提供了一种结构化的响应格式，允许 AI 智能体与多个工具进行交互，同时在交互过程中保持上下文记忆。它支持：

一键调用 AI 工具：开发者可通过单次 API 调用，整合多种 AI 工具，让任务执行更加高效。
计算机操作：使用计算机操作工具，直接驱动软件自动化，提升操作效率。
文件搜索：动态检索企业数据，提取精准信息。
函数调用：支持开发和调用自定义函数，增强智能体处理能力。
支持多轮交互：通过唯一 Response ID 关联对话，使互动具备上下文记忆，实现更自然的智能交互。
企业级安全合规：基于 Azure 的安全与合规标准，确保企业数据隐私无忧。

通过将检索、推理和执行操作整合到一个 API 中，大幅降低 AI 智能体开发的复杂度，让企业无需担心多个 AI 工具的编排，轻松构建自动化工作流。

这种可扩展性非常适用于客服、IT 运营、金融和供应链管理等行业，在这些行业中，由 AI 技术驱动的自动化可以简化工作流程并提高效率。为了获得更大的灵活性和管理能力，企业还可以结合 Azure AI Agent Service。Azure AI Agent Service提供更丰富的工具和模型，支持 Semantic Kernel 和 AutoGen，让多个智能体高效协作，应对更复杂的业务场景。

计算机操作智能体（CUA）：

具备“自主操作”能力

计算机操作智能体（CUA）是 Azure OpenAI 服务（国际版）的一款专用 AI 模型，具备自主操作图形用户界面（graphical user interfaces, GUIs）的能力。通过自然语言指令，计算机操作智能体可以与应用程序互动并自动执行多步操作、解释视觉元素、动态适应并根据屏幕内容采取进一步操作。

计算机操作智能体（CUA）的优势

✅ 自主 UI 交互：无需预设脚本，即可打开应用、操作界面、完成多页面任务。

✅ 动态适应：智能识别 UI 变化，灵活调整执行步骤，减少对预设自动化脚本的依赖。

✅ 跨应用执行任务：可同时操作 Web 和桌面应用，无需 API 适配，打破系统壁垒。

✅ 自然语言命令界面：用户只需使用自然语言描述任务，CUA 便可自动解析并执行相应操作。

此外，我们还在探索 CUA 与 Windows 365 和 Azure 虚拟桌面（AVD）的深度集成，未来企业可在云端托管 CUA，实现大规模 AI 自动化，同时确保合规性和安全性。这不仅是智能体的进化，更是 AI 生产力的全新篇章！

CUA 如何保障安全与可信

随着 AI 智能体的自主性不断增强，如何确保其安全性、可靠性，并符合用户意图成为核心议题。作为首批能直接操作软件环境的智能体模型之一，计算机操作智能体（CUA）在提升自动化能力的同时，也带来了防滥用、规避误操作和对抗性风险等新挑战。为此，微软与 OpenAI 构建了一套多重安全防护机制，涵盖模型、本地系统及企业部署环节，确保 AI 应用安全可控。

模型级别安全：CUA 内置安全策略，可拒绝执行恶意任务、屏蔽未经授权的操作，并防止滥用。
系统级监控：微软提供企业级内容过滤与执行监控，实时检测并拦截违规操作。
关键任务确认：为降低误操作风险，CUA 设计了用户确认机制，在执行不可逆任务前提醒用户，并限制涉及高风险操作（如金融交易）。
企业合规保障：基于微软可信 AI 框架，提供实时可观测性、日志记录及合规审计，确保企业部署运行透明、合规可控。
风险检测与强化：微软结合自动化+人工审核机制，监测 AI 执行模式，识别异常行为，并通过内部测试、外部审计及真实场景测试，不断优化安全策略，防御提示注入、对抗性攻击和未经授权的访问。