微信扫码
添加专属顾问
我要投稿
探索AI Agent智能体的未来,见证OpenHands如何引领自主思考的新时代。核心内容:1. OpenHands智能体的自主操作与协作能力2. 技术原理与项目架构深度解析3. AI应用层的未来趋势与挑战
04计算机创业男孩,AI算法工程师,一人公司,AI项目变现5位数!
今天聊一下很硬的干货。
我之前就有预测了“2025是AI Agent爆发的一年”
今天分享一个有关Agent智能体的开源项目,OpenHands---简要概括就是一个更加具有自由度的Agent
相较于传统的Agent(只可以简单调用API,如查天气、查新闻),OpenHands具有更大自由度:
可以自主操作电脑:OpenHands可以像人类一样操作电脑,包括打开应用、代码编写、命令行操作、网页浏览等
可以进行多智能体协作:多个OpenHands智能体可以相互配合,共同完成复杂任务
具有记忆和规划能力:能够记住之前的操作和经验,并据此制定合理的行动计划,计划推进时可以实时监测优化。
首先在模型层方面,我认为已经到达一个小阶段的顶峰了,下一个突破可能需要很长时间。
另外现在 AWS乃至阿里云等从云服务层面开始降低开发者成本了,所以Agent整体进程应该会持续加快。
简单的AI应用未来恐怕越来越难以生存,大家对AI应用的预期整体会被越来越多的Agent拉上去。
“Agent+”的产品将会越来越多,未来将有望成为 AI 应用层的基本架构.
其次有开发者说Agent会直接融入模型层,这也是未来有可能的,但是Agent+有缺点,那就是时间成本与费用Token消耗极大。
整体构架图如下 系统主要分成两部分, 一部分是web前端,负责处理和用户的交互,并显示结果。而后端负责处理业务逻辑,并执行智能体。 项目部署的时候, 前端编译成静态html,服务端用python 实现,默认监听端口3000, 为一个web server。 当用户新创建一个工程的时候,或者一个全新的会话时, python 后端服务会启动一个 docker 的container,处理该工程项目。
前端主要有3个页面, 一个是设置页, 主要是设置大模型相关的; 一个是聊天,负责处理用户的请求,并调用大模型,另外一个页面,是vscode 的页面。
核心, 是接受请求, 然后创建 session, 当用户发送请求后, 由Agent 对用户请求进行分析, 创建 Plan, 同时会创建一个CommandManager, 在第一次的时候, 会创建一个Docker sandbox,比如命令运行, 文件创建, 这些, 都会通过 CommandManager 下发到docker 执行。对于每次会话, 会有一个State 来维护整个周期的交互。 包括 本次任务的Plan,递增的交互id, 后台行为的Observation列表, 行为执行历史, 以及更新信息列表。 对于每个下发的命令 , 会有一个Observer, 来监听命令的执行。
1.【Bob 的 AI 成长陪伴群】门票 49/年
?AI 前沿技术、NLP 知识技术分享、前瞻思考、面试技巧、找工作等
? 个人 IP 打造、自媒体副业、向上社交、以及我的日常生活所见所闻,所思所想。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-05
Free QWQ - 世界首个免费无限制分布式 QwQ API
2025-04-05
体验 DeepSite:AI 辅助开发神器,实力与局限并存
2025-04-05
私有知识库+本地300种模型一键部署,私密性拉满!这个国产开源工具太绝了
2025-04-05
Dify+RAGFlow:1+1>2的混合架构,详细教程+实施案例
2025-04-04
AI 时代如何更高效开发前端组件?21st.dev 给了一种答案
2025-04-04
使用 Meta 系列模型构建
2025-04-04
OpenAI推出免费学习社区,让你悄悄变强
2025-04-04
OpenAI 免费 “AI 补习班”:教你偷偷变强!『OpenAI Academy』
2025-01-01
2024-07-25
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-06-12
2024-07-11
2024-08-13
2024-12-26
2025-04-03
2025-04-03
2025-04-03
2025-04-01
2025-03-31
2025-03-25
2025-03-25
2025-03-24