我要投稿

一文讲透OpenManus开发：功能、架构与实战指南

发布日期：2025-03-16 19:48:25 浏览次数： 4431

作者：加加笔记

微信搜一搜，关注“加加笔记”

这篇为自己的学习笔记，包含整理的内容和简单实验。

一、项目核心功能解析

1.1 核心定位

OpenManus 是一个多功能AI代理框架，通过组合工具链实现复杂任务自动化。其核心功能包括：

多工具联动
：支持 Python 执行、网页搜索、文件操作、浏览器控制等工具
智能流程规划
：内置规划代理（Planning Agent）自动拆解任务
LLM 驱动交互
：基于 GPT-4 等模型实现自然语言交互
跨平台兼容性
：支持 Docker 部署和多种操作系统

二、代码架构深度解析

2.1 核心模块结构

2.2 关键组件详解

代理层（Agent）

Manus

类（app/agent/manus.py）：

class Manus(ToolCallAgent):
    available_tools = ToolCollection(
        PythonExecute(), WebSearch(), BrowserUseTool(), FileSaver(), Terminate()
    )

规划代理（app/agent/planning.py）：

class PlanningAgent(ToolCallAgent):
    async def act():
        # 执行工具并更新计划状态

工具层（Tool）

基础工具抽象：

class BaseTool:
    name: str
    description: str
    async def execute(self, **kwargs): ...

具体工具实现：

class WebSearch(BaseTool):
    async def execute(self, query):
        # 调用搜索引擎API

流程控制

流程工厂（app/flow/flow_factory.py）：

class FlowFactory:
    @staticmethod
    def create_flow(flow_type):
        if flow_type == FlowType.PLANNING:
            return PlanningFlow(agents=agents)

三、开发流程实战指南

3.1 快速启动步骤

# 推荐使用 uv 安装（片段4）
uv pip install -r requirements.txt
python run_flow.py

3.2 核心执行流程

3.3 配置关键点

API 密钥配置（config/config.toml）：

[llm]
model = "gpt-4o"
api_key = "sk-..."

浏览器配置（app/config.py）：

class Config:
    def browser_config(self) -> BrowserSettings:
        # 返回浏览器设置参数

四、典型应用场景

4.1 日本旅行规划案例

用户输入：

需要制定4月15-23日从西雅图出发的7日日本行程，预算2500-5000美元，包含历史遗迹、文化体验（剑道、茶道）和奈良鹿等元素，需生成带地图和日语短语的HTML手册。

执行流程：

规划阶段
：

使用 WebSearch 查询景点信息
PythonExecute
处理预算计算
执行阶段
：

BrowserUseTool
访问旅游网站
FileSaver
保存生成的HTML手册

输出结果

：

await tool.execute(save_path="/output/travel_plan.html")

示例输出：

五、代码结构深度解析

5.1 目录结构图

5.2 核心类关系

代理-工具协作：

class Manus(ToolCallAgent):
    async def act():
        tool = self.available_tools.get("WebSearch")
        result = await tool.execute(query)

流程执行器：

async def run_flow():
    flow = FlowFactory.create_flow(FlowType.PLANNING)
    await flow.execute(user_prompt)

六、进阶开发技巧

6.1 新增工具开发

# 新建 tool/my_tool.py
classMyTool(BaseTool):
    name ="my_tool"
    asyncdefexecute(self, param):
        # 实现工具逻辑
        return"执行结果"

# 注册到代理
classCustomAgent(Manus):
    available_tools.add_tool(MyTool())

6.2 自定义提示词

# 修改 prompt/manus.py
SYSTEM_PROMPT = "您现在是旅游规划专家..."
NEXT_STEP_PROMPT = "优先使用WebSearch获取最新景点信息..."

七、生态与社区

7.1 依赖管理

八、总结

OpenManus 通过模块化设计和强大的工具链，实现了从简单查询到复杂任务的全流程自动化。其核心优势在于：

灵活的代理架构
：支持多种代理类型和工具组合
清晰的执行流程
：从规划到执行的完整生命周期管理
丰富的扩展性
：通过插件机制实现功能扩展

通过本文的深度解析，开发者可以快速掌握该项目的核心原理和开发方法，实现从理解到实践的完整跨越。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-10

通义开源WebSailor：超越DeepSeek R1，最接近闭源系统的网络智能体来了！

2025-07-10

震撼！大模型一体化推训平台开源！

2025-07-10

AI智能体大爆发！五大开源重磅发布，彻底改变你的开发范式

2025-07-09

Prompt Optimizer — AI 提示词优化神器

2025-07-09

昆仑万维发布 Skywork-R1V3.0：开源模型挑战多模态推理极限，逼近人类专家水平

2025-07-09

一文带你读懂 Google LangGraph 项目，快速入门 AI Agent 全栈开发

2025-07-08

大模型开源许可解析：脉络与最新发展趋势

2025-07-08

探索 RAG-Anything：开启多模态 RAG 的新纪元，让文档“活”起来！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

15个最佳开源 RAG 框架选型指南

2025-04-13

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

Qwen3中性能最强MOE模型部署抛砖引玉 + 实测

2025-04-29

手搓Manus？MCP 原理解析与MCP Client实践

2025-04-15

阿里Qwen3正式发布：最小6亿参数，叫板Gemini-2.5Pro

2025-04-29

刚刚，DeepSeek开源新版R1，媲美OpenAI最高o3模型

2025-05-29

豆包电脑版不讲武德降维打击本地部署AI知识库的开源选手

2025-05-12

事实证明千问qwen3小模型才是企业的生产力，他究竟能做什么呢？

2025-05-14

大家都在问

国内 Agent 赛道最大融资诞生！阿里云为何重注这家“真能干活”的 AI 公司？

2025-07-08

大模型开源，厂商靠什么盈利？

2025-07-04

OpenAI首席研究官没有博士学位，你的985还有用吗？

2025-07-03

卷疯了！这个清华系Agent框架开源后迅速斩获1.9k stars，还要“消灭”Prompt？

2025-06-28

从 MCP 谈起，到底什么才是 AI Native 产品？

2025-06-25

中国AI Agent市场最终会变成一地鸡毛吗？

2025-06-25

如何使用 Agno 构建一个基础的 AI 智能体？

2025-06-21

开源AI工具Magentic UI，凭什么让你的工作效率提升300%？

2025-06-16

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB