我要投稿

AI Agent带来哪些安全风险？如何应对？

发布日期：2024-09-27 07:32:50 浏览次数： 2527 作者：沙丘社区

根据沙丘智库发布的《2024中国AI Agent市场指南》，AI Agent是一种具有自主性或半自主性的智能实体，能够利用人工智能技术在数字或物理环境中感知、决策、采取行动并实现目标，这种能力使得AI Agent有可能彻底改变各行各业和各种环境。

大模型缺少在最少的人类监督下自主行动的能力，以及在复杂环境中适应和执行目标的能力，基于大模型的AI Agent利用大模型理解、思考输出的“专家能力”，并附加规划、记忆、执行、工具调用能力，可以替代大量人工执行，消除大模型和真实世界沟通的障碍，解决大模型落地的“最后一公里”。

AI Agent带来的新风险

AI Agent具有巨大的应用潜力，但同时也带来了新的安全风险。传统AI模型和应用的安全风险通常限于模型输入、模型处理和模型输出、编排层的软件漏洞以及托管它们的环境。除了这些威胁外，AI Agent还引入了新的人工智能风险。

在使用AI Agent时，安全风险范围扩大到了AI Agent触发和参与的一系列事件和交互中，这些通常对人类或系统操作员来说是不可见的，也无法进行阻止。

AI Agent在执行任务时可能引入的一系列安全问题，包括数据安全、资源管理、恶意活动、编码错误、供应链安全以及恶意代码的传播等，这些问题需要通过适当的安全措施进行解决。AI Agent带来的安全风险包括：

· 数据暴露或外泄：AI Agent在执行任务的过程中可能会在任何环节暴露或外泄敏感数据；

· 过度消耗系统资源：AI Agent在执行和交互的过程中可能会无节制地消耗大量系统资源，无论是有意还是无意，这可能导致系统资源过载；

· 未授权或恶意活动：AI Agent可能会有意或无意地执行未授权或恶意的活动，例如恶意程序或人类的Agent“劫持”行为；

· 编码逻辑错误：AI Agent可能会由于编码逻辑错误导致数据泄露或其他威胁，这些错误可能是未经授权的、意外的或恶意的；

· 供应链风险：使用从第三方网站下载的库或代码用于AI Agent可能会带来供应链风险，这些代码可能被植入了恶意软件，旨在执行恶意任务；

· 恶意代码的传播和复制：使用自动化的Agent流程可能会传播和复制恶意代码，以及通过检索增强生成（RAG）对Agent进行“投毒”触发恶意行为。

AI Agent安全风险的应对措施

为了应对上述AI Agent安全风险，企业应采取如下措施：

第一，监控所有AI Agent的行动和信息流；

第二，检测和标记异常的AI Agent行动；

第三，尽可能地使用自动化手段实时修复问题。

这些措施的访问权限应授予给IT、安全或任何其他需要管理AI Agent风险的管理员用户。

（1）监控所有AI Agent的行动和信息流

为了检测异常和违规行为，需要给AI Agent的行动、流程、连接、数据暴露、信息流、输出和响应提供一个全面的仪表盘视图。同时，还需要支持对Aengt的所有交互和活动进行不可更改的审计跟踪。

仪表盘视图应支持对以下内容的可见性：

· 输出的使用情况：AI Agent的输出是如何随时间被组织使用的；

· AI Agent的使用场景：AI Agent被用于哪些具体的用例；

· AIAgent的交互意图：例如Agent的目标、行为和通信方式；

· 是否遵循企业政策：AI Agent的表现是否符合企业可接受的使用政策；

· 是否遵循安全、隐私和法律要求：AI Agent的表现是否符合相关的安全、隐私和法律要求；

· 将AI Agent的行动与企业身份和访问管理（IAM）系统集成，确保可以确定访问权限，并实施最小权限访问控制。

（2）检测和标记异常的AI Agent行动

检测并标记那些异常的AI Agent行动以及违反了企业相关政策的行动。企业在建立了仪表盘视图、确定了预期的行动基线后，就可以开始检测异常的交易和行动。

考虑到AI Agent交互的速度和数量，人工无法进行所有的监督和修复，因此应尽可能对异常交易进行自动修复；对于无法自动修复的异常情况，应该立刻暂停，并转给人工进行审查和修复。

（3）尽可能地使用自动化手段实时修复问题

修复措施应包括适当的限制和缓解措施：

· 数据脱敏：当企业定义的敏感数据（例如，个人身份信息或机密的非结构化信息）传递给Agent系统时，进行脱敏处理；

· 实施最小权限访问：尽可能实施最小权限访问控制。如果检测到违规行为且无法自动修复，则阻止访问，并将问题转发给人工审查和解决；

· 支持特定Agent威胁指标的拒绝列表：基于企业数据相关的威胁情报制定一个特定Agent威胁指标的拒绝列表，Agent在行动时需要根据列表进行验证；

· 支持文件和文件类型的拒绝和接受列表：定义Agent可以访问和不可以访问的文件和文件类型，包括在RAG中支持Agent工作流的文件；

· 实施监控和反馈循环：通过实施监控和反馈循环，识别由于不准确性导致的不需要的行动。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-19

万字长文带你在AI时代重塑自身价值

2025-04-19

零代码，用 Cursor 快速打造个人主页，颜值爆表！

2025-04-19

Manus 邀请码秒过？我的 Manus 初体验

2025-04-18

利用 AI 提升设计

2025-04-17

AI 驱动的 SEO：尖端内容制作的 4 项原则（附Deep Seek优化独立站技巧）

2025-04-17

别让 AI 沦为浅层工具

2025-04-17

Cline 3.12 来了，在AI编程工具这条赛道上，Cline一骑绝尘

2025-04-17

Cursor + MCP 要冲击的不仅是前端

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Manus横空出世，如何获取邀请码

2025-03-06

Kimi、豆包与ChatGPT的对比分析

2024-09-04

从探索到落地：全面解析2024年AI在各行业的突破与应用

2025-01-25

国内用户如何使用ChatGPT高级实时语音功能教程

2024-09-26

豆包AI全攻略：八大功能详解与实操指南

2024-10-30

看完这篇，终于知道怎么选AI做PPT的工具了！

2024-09-03

让大模型写小说太难？试试雪花十步写作法，轻松突破瓶颈！

2024-12-11

新手必看：Cursor软件编写微信小程序全攻略

2024-12-25

对话Kyth：小宇宙CEO如何理解AI播客？

2024-10-30

深度复盘｜做AI产品近2年总结出来的25条核心认知

2025-02-18

大家都在问

DeepSeek生成的Html网页，怎么分享给别人访问？

2025-04-16

专访Answer.AI创始人周立：AI时代，学什么在未来是有用的？

2025-04-15

Agent落地有哪些挑战？如何应对？

2025-04-13

AI创业的真相：从"脏活累活"到成功秘诀，谁在决定AI的未来？

2025-04-07

AI会改变知乎和小红书吗？

2025-03-25

一夜爆火的通用 Agent，Manus 效果到底如何？

2025-03-24

论文AI率怎么查出来的？查出来后需要降吗？如何降？

2025-03-19

完整复盘：Manus 是怎么诞生的？

2025-03-15

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB