微信扫码
和创始人交个朋友
我要投稿
AI网关在企业数字化转型中的关键角色和核心能力解析。 核心内容: 1. AI网关与API网关的关系和区别 2. API网关在研发、供应和消费三大场景下的能力要求 3. API安全、可用性和高效性的重要性及实现方法
大模型主战场从训练转向推理,已经成为业内共识。越来越多的公司已经开始设计满足企业内部需求和外部商业方向的大模型应用,并在生产环境中进行部署。这个过程中,我们遇到了一系列新的需求。
这些需求与最初的大模型应用在 “概念验证阶段” 有所不同,更多地源于对规模化和安全使用,其中,AI 网关成为被讨论较多的 AI 基础设施关键组件之一。
我们认为 AI 网关并不是独立于 API 网关的新形态,本质也是一种 API 网关,区别在于针对 AI 场景的新需求专门做了扩展,它既是 API 网关的继承,也是 API 网关的演进。因此我们从 API 视角,对 AI 网关的能力做了分类,便于形成概念的共识。
由于围绕 API 提供的网关能力繁多,涉及的角色众多,我们将所有能力基于使用方进行分类,包括研发、供应和消费三类场景,分别对应 API 接口的研发团队、API 平台的研发和运维团队、API 平台的外部调用方。
API First 是先定义好 API 规范,再 code。不同于不定义 API,直接 coding,API First 强调的是在构建应用程序之前优先设计和开发 API 接口,将 API 视为系统的核心架构组件,通过定义良好的接口规范实现模块化。例如公共云的云产品都提供了 API 的调用方式,微信小程序、钉钉开放平台也面向开发者提供了 API 接口,类似乐高积木的模块化系统,通过标准接口实现服务间的灵活组合,提升系统的可扩展性和维护性,从而提升生态效率。
API 供应场景指 API 提供方(如企业、平台或服务)通过标准化接口对外暴露数据或功能的过程。其核心是创建、管理和维护 API,确保其可用性、安全性和高效性。核心能力包括:
API 安全:保护 API 免受各种安全威胁,确保只有经过授权的用户、应用程序能够访问 API,并保障数据在传输和存储过程中的保密性、完整性和可用性。例如身份验证、授权管理、数据加解密、防攻击机制。
灰度:是一种在生产环境中逐步引入新 API 版本或功能的策略,允许将一部分用户或请求流量导向新版本的 API,同时将其余部分仍保持在旧版本上,从而在不影响整体系统稳定性和用户体验的前提下,对新 API 进行测试和验证。
缓存:指将 API 的响应结果临时存储在缓存服务器中,当有相同的请求再次到来时,直接从缓存中获取响应结果,而无需再次访问后端服务器,从而提高 API 的响应速度和系统的性能。
API 消费场景指调用方(如应用、开发者)通过集成外部 API 快速实现功能或获取数据的过程。其核心是使用平台方提供的能力或数据,实现业务需求。
调用审计:对 API 的调用活动进行全面记录、监控和分析的过程。它会详细记录每一次 API 调用的相关信息,包括调用时间、调用方身份、调用的 API 接口、请求参数、响应结果、响应时间等。
调用方配额限速:指 API 网关根据预先设定的规则,对每个调用方(如用户、应用程序、IP 地址等)在一定时间内对 API 的调用次数、流量大小或资源使用量进行限制的机制。
后端保护式限流:对 API 的访问流量进行管理和控制,确保 API 能够稳定、高效地运行,避免因流量过大或异常流量导致的系统崩溃和性能下降,包括负载均衡、限流、降级、熔断等能力。
在大模型场景下,大模型通过 API 对外提供服务,因此研发场景、供应场景、消费场景都出现了更加丰富的诉求。
得益于 Wasm 插件的动态扩展能力,Higress 在 AI 时代快速演进并发展 AI 时代的能力。本文提到的大模型 API 管理底层能力,均已经在开源 Higress 和阿里云云原生 API 网关上线:
Higress 开源控制台
阿里云云原生 API 网关控制台
同时,在阿里云云原生 API 网关上我们提供了 AI API 管理能力,可以更便捷更高效地管理 AI 时代的 API:
创建 AI API 选项
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-20
9人团队2年狂揽1000万美金!这家华人创立的AI公司,正在掀翻尼康佳能的百年江山
2025-02-20
上海申通地铁集团打造智能内容审核系统,为乘客提供绿色安全出行空间|案例研究
2025-02-19
私有化部署DeepSeek,你需要准备怎样的硬件配置?
2025-02-19
问小白接入 DeepSeek,亲测全网最快!
2025-02-19
腾讯元宝DeepSeek-R1体验:一款真香的AI助手,但广告植入要来了?
2025-02-19
一文讲清Nvidia GPU和阿里云GPU异构机型
2025-02-18
DeepSeek-R1 昇腾910B满血版部署避坑指南
2025-02-17
实施部署DeepSeek,可能不是一门好生意
2024-03-30
2024-05-09
2024-07-07
2024-07-23
2024-06-23
2024-07-01
2024-06-24
2024-10-20
2024-06-08
2024-12-29
2025-02-19
2025-02-19
2025-02-05
2025-02-05
2025-01-22
2025-01-15
2025-01-13
2025-01-12