微信扫码
添加专属顾问
我要投稿
深入揭秘Manus沙盒代码,揭开智能体的秘密。核心内容: 1. Manus沙盒代码的破解和开源 2. 沙盒代码的作用和系统架构解析 3. 项目关键组件及FastAPI服务层介绍
嘿,大家好!这里是一个专注于前沿AI和智能体的频道~
上周,manus的沙盒代码被诱导之后,可以打包下载。
但是下载完成打开,虽然start_server.py确实可以直接运行起来,但是整个代码项目是加密的~
代码是pyarmor加密的,这个正常逆向是很麻烦的。所以之前留言,我都回复了等大佬开源就好了。然后他来了~
接下来简单看看这个项目的实现逻辑!
现在都是明文了
首先需要注意的是,沙箱代码并不是manus的真实代码。他只是提供一个安全、隔离的容器给大模型,让它可以与终端、浏览器交互。充当大模型与资源之前的桥梁,使得AI可以自主运行终端命令、浏览器操作、编辑文本等等。
┌───────────────────────────┐ ┌─────────────────┐ ┌────────────────────────────────────────────┐
│ │ │ │ │ Sandbox Container │
│ AI Agent (e.g. Claude) │ │ API Proxy │ │ │
│ │ │ │ │ ┌──────────┐ ┌─────────┐ ┌────────────┐ │
│ MANUS │ API Requests │ - Auth check │ │ │ │ │ │ │ │ │
│ │◄──────────────►│ - Rate limiting├─────►│ │ Terminal │ │ Browser │ │ File/Text │ │
│ │ & Responses │ - Routing │ │ │ Service │ │ Service │ │ Operations │ │
│ │ │ │ │ │ │ │ │ │ │ │
│ │ │ │ │ └────┬─────┘ └────┬────┘ └─────┬──────┘ │
└───────────────────────────┘ └─────────────────┘ │ │ │ │ │
x-sandbox-token │ │ │ │ │
authentication │ v v v │
│ ┌──────────────────────────────────────┐ │
│ │ FastAPI │ │
│ │ (app/server.py + router.py) │ │
│ └──────────────────────────────────────┘ │
│ │
└────────────────────────────────────────────┘
整个项目主要包含以下几个关键组件:
项目使用FastAPI构建了一个HTTP服务(app/server.py
),作为AI与沙盒交互的主要入口点。所有来自AI的请求都会经过这一层处理,然后路由到对应的功能模块。
终端服务允许AI直接执行shell命令,并实时获取输出结果。对于需要持续交互的场景,它还提供了基于WebSocket的实时通信(app/terminal_socket_server.py
)。
这部分功能使得大模型可以:
browser_use库的集成。这是一个经过修改的开源库,让AI能够通过API控制浏览器行为。
browser_use主要包含以下功能模块:
class Agent:
def __init__(
self,
task: str,
llm: BaseChatModel,
browser: Browser | None = None,
# 其他参数...
):
# 初始化组件
async def run(self, max_steps: int = 100) -> AgentHistoryList:
# 主执行循环
# 处理LLM输出并执行动作
这个类是浏览器自动化的核心,负责将AI的指令转化为具体的浏览器操作。
在context.py里边 提供了一系列方法让AI与网页交互:
这部分应该是跟原始仓库一样的,没有仔细对比。 定义了告诉AI如何与浏览器交互的指令集,包括:
AI与沙盒之间的通信流程:
AI制定请求:
请求传输:
https://api.manus.im/apiproxy.v1.ApiProxyService/CallApi
)认证:
x-sandbox-token
头)$HOME/.secrets/sandbox_api_token
中的值进行验证请求处理:
返回响应:
例如,AI执行一个shell命令的流程是这样的:
┌─────────────┐ ┌───────────────┐ ┌──────────────────┐
│ │ 1. HTTP请求 │ │ 2. 路由到 │ │
│ AI 代理 │────────────────►│ 沙盒API │─────────────►│ 终端服务 │
│ │ │ (FastAPI) │ │ │
│ │◄────────────────│ │◄─────────────│ │
└─────────────┘ 4. JSON响应 └───────────────┘ 3. 执行命令 └──────────────────┘
通过这个沙盒环境,Claude等大模型可以执行如网页自动化、开发调试代码、执行系统指令、管理文件进程等操作。
逆向开源项目地址:https://github.com/whit3rabbit/manus-open
搭配完整的manus system prompt、tool description食用更佳: https://gist.github.com/jlia0/db0a9695b3ca7609c9b1a08dcbf872c9
好了,这就是我今天想分享的内容。如果你对构建AI智能体感兴趣,别忘了点赞、关注噢~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-17
不到 4 万元的 DeepSeek-R1-671B-Q8 部署方案
2025-03-17
OWL深入分析,打造个人通用Agent
2025-03-17
小参数出奇迹!360开源最强14B推理模型,端侧部署春天来了?
2025-03-17
大模型工具Dify-窥探
2025-03-17
火爆 AI 编程圈的 MCP 到底是个什么东西?
2025-03-17
怎样使用AnythingLLM 和 DeepSeek 创建私有智能体
2025-03-16
轻松部署Gemma3-27B,L20服务器+最新版vLLM高效推理
2025-03-16
DeepSeek教育一体机让学校用上大模型,进入智慧校园新阶段
2025-01-01
2024-07-25
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-06-12
2024-08-13
2024-07-11
2024-12-26
2025-03-17
2025-03-17
2025-03-13
2025-03-13
2025-03-08
2025-03-03
2025-03-02
2025-03-01