微信扫码
添加专属顾问
我要投稿
Anthropic工程师Barry Zhang分享高效AI Agent构建秘诀,洞见Agent系统演进趋势。 核心内容: 1. 构建有效Agent的三大要点 2. Agent系统演进的四个阶段 3. 何时构建Agent的检查清单
Anthropic 工程师 Barry Zhang 在 AI Engineer 工作坊上的一个分享 “如何构建有效的 Agent”,其中印象最深的一个观点:Don't build agents for everything,反过来理解就是别做什么都能干的 Agent,那是我们大模型要干的事情?
构建有效 Agent 的三大要点:
Barry 主要负责 Agentic System,演讲内容基于他和 Eric 合著的一篇博文,下面详细总结他们的核心观点,以及对 Agent 系统的演进和未来的思考。
Agent 系统的演进
Agent 主要用于扩展复杂且有价值的任务,它们成本高、延迟高,不应作为所有用例的直接升级。对于可以清晰映射决策树的任务,显式构建工作流(Workflow)更具成本效益和可控性。
何时构建 Agent 的检查清单:
编码(Coding)是一个很好的 Agent 用例,因为它任务复杂(从设计文档到 PR)、价值高、现有模型(如 Claude)在许多环节表现良好,且结果易于验证(单元测试、CI)。
Agent 的核心结构:
模型(Model)+ 工具(Tools)+ 循环(Loop)在一个环境(Environment)中运作。
三个关键组成部分:
1. 环境 (Environment): Agent 操作所在的系统。
2. 工具集 (Tools): Agent 采取行动和获取反馈的接口。
3. 系统提示 (System Prompt): 定义 Agent 的目标、约束和理想行为。
迭代方法:
优先构建和迭代这三个基本组件,能获得最高的投资回报率。避免一开始就过度复杂化,这会扼杀迭代速度。优化(如缓存轨迹、并行化工具调用、改进用户界面以增强信任)应在基本行为确定后再进行。
一致性:
尽管不同 Agent 应用(编码、搜索、计算机使用)在产品层面、范围和能力上看起来不同,但它们共享几乎相同的简单后端架构。
像 Agent 一样思考 (Think like your agents)
问题:
开发者常从自身角度出发,难以理解 Agent 为何会犯看似反常的错误。
解决方法:
将自己置于 Agent 的“上下文窗口”中。Agent 在每一步的决策都基于有限的上下文信息(如 10k-20k token)。
换位思考练习:
尝试从 Agent 的视角完成任务,体验其局限性(例如,只能看到静态截图,在推理和工具执行期间如同“闭眼”操作)。这有助于发现 Agent 真正需要哪些信息(如屏幕分辨率、推荐操作、限制条件)以避免不必要的探索。
利用模型自身:
可以直接询问模型(如 Claude):指令是否模糊?是否理解工具描述?为什么做出某个决策?如何帮助它做出更好的决策?这有助于弥合开发者与 Agent 之间的理解差距。
1. 预算感知 Agent (Budget-aware Agents):
需要更好地控制 Agent 的成本和延迟,定义和强制执行时间、金钱、token 预算,以便在生产环境中更广泛地部署。
2. 自进化工具 (Self-evolving Tools):
Agent 或许能设计和改进自己的工具(元工具),使其更具通用性,能适应不同用例的需求。
3. 多 Agent 协作 (Multi-agent Collaboration):
预计今年年底将在生产中看到更多多 Agent 系统。其优势包括并行化、关注点分离、保护主 Agent 上下文窗口等。关键挑战在于 Agent 间的通信方式,如何实现异步通信,超越当前的用户-助手轮流模式。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-19
RAG升级-基于知识图谱+deepseek打造强大的个人知识库问答机器人
2025-04-19
RAG vs. CAG vs. Fine-Tuning:如何为你的大语言模型选择最合适的“脑力升级”?
2025-04-19
低代码 RAG 只是信息搬运工,Graph RAG 让 AI 具备垂直深度推理能力!
2025-04-18
微软PIKE-RAG全面解析:解锁工业级应用领域知识理解与推理
2025-04-18
AI 记忆不等于 RAG:对话式 AI 为何需要超越检索增强
2025-04-18
Firecrawl:颠覆传统爬虫的AI黑科技,如何为LLM时代赋能
2025-04-18
什么是RAG与为什么要RAG?
2025-04-17
Fireworks AI 分析
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-19
2025-04-18
2025-04-16
2025-04-14
2025-04-13
2025-04-11
2025-04-09
2025-04-07