微信扫码
添加专属顾问
我要投稿
探索AI网关在现代企业中的关键作用和必要能力。 核心内容: 1. AI网关在大模型应用中的重要性 2. AI网关与API网关的关系和区别 3. AI网关在API研发、供应和消费场景中的关键能力
大模型主战场从训练转向推理,已经成为业内共识。越来越多的公司已经开始设计符满足企业内部需求和外部商业方向的大模型应用,并在生产环境中进行部署。这个过程中,我们遇到了一系列新的需求,这些需求与最初的大模型应用在 “概念验证阶段” 有所不同。这些新需求更多地源于对规模化和安全使用,其中,AI 网关成为被讨论较多的 AI 基础设施关键组件之一。
我们认为 AI 网关并不是独立于 API 网关的新形态,本质也是一种 API 网关,区别在于针对 AI 场景的新需求专门做了扩展,它既是 API 网关的继承,也是 API 网关的演进。因此我们从 API 视角,对 AI 网关的能力做了分类,便于形成概念的共识。
API 网关的继承
Cloud Native
API First 是先定义好 API 规范,再 code。不同于不定义 API,直接 coding,API First 强调的是在构建应用程序之前优先设计和开发 API 接口,将 API 视为系统的核心架构组件,通过定义良好的接口规范实现模块化。例如公共云的云产品都提供了 API 的调用方式,微信小程序、钉钉开放平台也面向开发者提供了 API 接口,类似乐高积木的模块化系统,通过标准接口实现服务间的灵活组合,提升系统的可扩展性和维护性,从而提升生态效率。
API 供应场景指 API 提供方(如企业、平台或服务)通过标准化接口对外暴露数据或功能的过程。其核心是创建、管理和维护 API,确保其可用性、安全性和高效性。核心能力包括:
缓存:指将 API 的响应结果临时存储在缓存服务器中,当有相同的请求再次到来时,直接从缓存中获取响应结果,而无需再次访问后端服务器,从而提高 API 的响应速度和系统的性能。
API 消费场景指调用方(如应用、开发者)通过集成外部 API 快速实现功能或获取数据的过程。其核心是使用平台方提供的能力或数据,实现业务需求。
API 网关的演进
Cloud Native
API First 或者 API 是一等公民不再是一种口号,而是逐步成为实实在在的应用开发规范。Agent 的开发和运行,要调用 API,Agent 通过开放平台形式提供对外服务,也要提供 API。API 网关可以覆盖 API 的设计、开发、测试、发布、售卖、运维监测、安全管控、下线等各个生命周期阶段,企业的诉求将更为强烈。基于 API 网关,还可以提供多个插件能力,提升 Agent 开发效率,例如 AI 提示词模版 [1],API AI Agent [2],Json 格式化 [3],用于根据默认或用户配置的 Json Schema 对 AI 的响应进行结构化等等。
多 API Key 均衡:API Key 是用于识别和验证调用方身份以及控制其对 API 访问权限的密钥。多 API Key 均衡就是当存在多个 API Key 时,API 网关通过一定的策略将 API 请求均匀地或根据特定规则分配到这些 API Key 上进行处理。
调用成本审计:大模型调用所消耗的计算资源远高于 Web 应用请求所消耗的计算资源,因此对调用成本的控制需求更加刚需。这里的调用既包括直接的经济成本,例如使用第三方 API 服务时需支付的费用,或者因 API 调用消耗企业内部计算资源(如服务器、存储、带宽等)而产生的成本;也包括间接成本,例如因 API 调用错误导致的资源成本等。
为什么要在网关上,
而非大模型服务层实现这些能力
Cloud Native
解耦系统:如果在大模型服务层实现 API 网关的功能,会导致大模型服务与 API 管理功能紧密耦合。当需要对 API 管理策略进行调整(如更改安全认证方式、调整流量限制规则)时,可能会影响到大模型服务的稳定性和性能。而在网关上实现 API 网关能力,可以将大模型服务与 API 管理解耦,使两者可以独立发展和升级,降低系统的复杂度和维护成本。
提高并发处理能力:网关可以通过负载均衡等技术,将大量的 API 请求均匀地分配到多个大模型服务实例上,提高系统的并发处理能力。如果在大模型服务层实现 API 网关功能,每个大模型服务实例都需要独立处理 API 管理任务,这会限制系统的并发处理能力。而网关可以集中处理这些任务,更好地应对高并发场景。
数据保护:网关可以对 API 请求和响应的数据进行加密、脱敏等处理,确保数据在传输和存储过程中的安全性。在大模型服务层处理这些数据保护任务可能会增加大模型的复杂性和计算负担。而在网关上统一处理,可以更好地保护用户的敏感信息,同时避免大模型直接接触敏感数据带来的安全风险。
支持多模型接入:在实际应用中,可能会同时使用多个不同的大模型服务。网关可以作为统一的接入点,为不同的大模型服务提供相同的 API 管理服务,方便对多个大模型进行管理和调度。如果在每个大模型服务层分别实现 API 网关功能,会增加系统的复杂性和管理难度。
故障排查与定位:当出现 API 调用故障时,在网关上可以更容易地进行故障排查和定位。网关可以记录每个 API 请求的详细信息,包括请求的来源、请求参数、响应结果等,通过分析这些信息可以快速确定故障的原因和位置,减少故障修复的时间和成本。
AI 网关的演进方向
Cloud Native
阿里云云原生 API 网关控制台
同时在阿里云云原生 API 网关上我们提供了 AI API 管理能力,可以更便捷更高效地管理 AI 时代的 API:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-05-09
2024-07-23
2024-07-07
2025-02-12
2024-07-01
2024-06-24
2024-06-23
2024-10-20
2024-06-08
2025-04-21
2025-04-13
2025-04-11
2025-04-03
2025-03-30
2025-03-28
2025-03-26
2025-03-13