支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Azure AI Foundry 发布 Responses API 与计算机操作智能体(CUA)

发布日期:2025-03-24 18:10:30 浏览次数: 1570 来源:Azure云科技
推荐语

Azure AI Foundry引领AI自动化新纪元,企业智能化转型的加速器。

核心内容:
1. Azure AI Foundry发布Responses API,打造智能型AI
2. 计算机操作智能体(CUA)突破软件自动化瓶颈
3. 集成多AI工具,简化开发,提升企业智能生产力

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家



AI 智能体正在重塑各行各业,推动自动化变革、提升生产力、赋能智能决策。企业已广泛应用 AI 智能体来处理保险理赔、IT 服务管理、优化供应链物流,甚至辅助医生分析医疗记录,智能技术的潜力正在不断拓展。近期,Azure AI Foundry 正式推出两项重磅创新:


  • Responses API:一款强大的 API,可帮助 AI 应用高效获取信息、处理数据并执行操作,让智能决策更加流畅。

  • 计算机操作智能体(CUA):一款突破性的 AI 模型,能够自主操作软件界面、执行任务、自动化处理工作流。 


这两项创新将帮助企业进一步解锁 AI 技术潜能,让 AI 不只是助手,更成为企业的虚拟劳动力,从而推动大规模自动化,提升效率,加速智能化升级。 


01

Responses API:

让 AI 智能体开发更简单、更强大 


在 Azure AI Foundry 中,Responses API 是打造“智能型 AI”的关键,为企业带来更强的智能生产力。它不仅是 Azure OpenAI 服务(国际版)内置工具的新基石,还融合了 Chat Completions API 的简洁性、Assistants API 和 Azure AI Agent Service 的高级能力,让企业可以更轻松地将 AI 技术赋能到业务流程中。 

借助 Responses API: 

只需调用一次即可实现与 CUA、函数执行、文件搜索等工具无缝交互,实现更智能的任务自动化。  

数据检索、信息处理、执行任务,现实与多工作流无缝衔接。 


02

Responses API 

如何助力 AI 智能体?


Responses API 提供了一种结构化的响应格式,允许 AI 智能体与多个工具进行交互,同时在交互过程中保持上下文记忆。它支持: 


  • 一键调用 AI 工具:开发者可通过单次 API 调用,整合多种 AI 工具,让任务执行更加高效。

  • 计算机操作:使用计算机操作工具,直接驱动软件自动化,提升操作效率。

  • 文件搜索:动态检索企业数据,提取精准信息。 

  • 函数调用:支持开发和调用自定义函数,增强智能体处理能力。

  • 支持多轮交互:通过唯一 Response ID 关联对话,使互动具备上下文记忆,实现更自然的智能交互。 

  • 企业级安全合规:基于 Azure 的安全与合规标准,确保企业数据隐私无忧。 




通过将检索、推理和执行操作整合到一个 API 中,大幅降低 AI 智能体开发的复杂度,让企业无需担心多个 AI 工具的编排,轻松构建自动化工作流。 


这种可扩展性非常适用于客服、IT 运营、金融和供应链管理等行业,在这些行业中,由 AI 技术驱动的自动化可以简化工作流程并提高效率。为了获得更大的灵活性和管理能力,企业还可以结合 Azure AI Agent Service。Azure AI Agent Service提供更丰富的工具和模型,支持 Semantic Kernel 和 AutoGen,让多个智能体高效协作,应对更复杂的业务场景。 


03

计算机操作智能体(CUA):

具备“自主操作”能力 


计算机操作智能体(CUA)是 Azure OpenAI 服务(国际版)的一款专用 AI 模型,具备自主操作图形用户界面(graphical user interfaces, GUIs)的能力。通过自然语言指令,计算机操作智能体可以与应用程序互动并自动执行多步操作、解释视觉元素、动态适应并根据屏幕内容采取进一步操作。 


04

计算机操作智能体(CUA)的优势


自主 UI 交互:无需预设脚本,即可打开应用、操作界面、完成多页面任务。 

动态适应:智能识别 UI 变化,灵活调整执行步骤,减少对预设自动化脚本的依赖。

跨应用执行任务:可同时操作 Web 和桌面应用,无需 API 适配,打破系统壁垒。  

自然语言命令界面:用户只需使用自然语言描述任务,CUA 便可自动解析并执行相应操作。 


此外,我们还在探索 CUA 与 Windows 365 和 Azure 虚拟桌面(AVD)的深度集成,未来企业可在云端托管 CUA,实现大规模 AI 自动化,同时确保合规性和安全性。这不仅是智能体的进化,更是 AI 生产力的全新篇章!  


05

CUA 如何保障安全与可信 


随着 AI 智能体的自主性不断增强,如何确保其安全性、可靠性,并符合用户意图成为核心议题。作为首批能直接操作软件环境的智能体模型之一,计算机操作智能体(CUA)在提升自动化能力的同时,也带来了防滥用、规避误操作和对抗性风险等新挑战。为此,微软与 OpenAI 构建了一套多重安全防护机制,涵盖模型、本地系统及企业部署环节,确保 AI 应用安全可控。 


  • 模型级别安全:CUA 内置安全策略,可拒绝执行恶意任务、屏蔽未经授权的操作,并防止滥用。 

  • 系统级监控:微软提供企业级内容过滤与执行监控,实时检测并拦截违规操作。 

  •  关键任务确认:为降低误操作风险,CUA 设计了用户确认机制,在执行不可逆任务前提醒用户,并限制涉及高风险操作(如金融交易)。 

  • 企业合规保障:基于微软可信 AI 框架,提供实时可观测性、日志记录及合规审计,确保企业部署运行透明、合规可控。 

  • 风险检测与强化:微软结合自动化+人工审核机制,监测 AI 执行模式,识别异常行为,并通过内部测试、外部审计及真实场景测试,不断优化安全策略,防御提示注入、对抗性攻击和未经授权的访问。


CUA 仍处于持续优化阶段,尤其是在非浏览器环境中的可靠性仍需进一步提升。因此,对于涉及高敏感度操作,我们仍然建议保持人工监督。 


随着 AI 智能体的不断演进,微软将持续加强透明度、安全性及风险防控,并结合 Azure 的企业合规与治理工具,确保企业能够安全、合规地大规模部署 AI 自动化。 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询