支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


3 周 3000 人 Star!让电脑自己干活。

发布日期:2025-04-13 16:31:25 浏览次数: 1560 作者:逛逛GitHub
推荐语

无需编程,轻松自动化你的电脑工作。

核心内容:
1. autoMate:AI+RPA自动化工具,解放双手
2. 基于OmniParser构建,支持自然语言交互
3. 部署指南:GitHub下载、环境搭建与启动方法

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
解放双手!无需编程知识,这个开源神器就能让你的电脑自己干活。
最近逛 GitHub 的时候,发现了个让人眼前一亮的项目:autoMate,开源 3 周目前已经斩获 3000+ Star,我称为打工人对抗重复工作的神器。
想象一下:每天下班前对着电脑说"帮我整理数据、做报表、回复邮件",第二天上班所有工作都已自动完成。

01

项目简介

autoMate 是一款基于 OmniParser 构建的革命性 AI+RPA 自动化工具,旨在通过自然语言交互让计算机代替人工完成重复性任务。
它结合了 AI 大模型和界面操作技术,能够理解用户指令、自主决策并模拟人类操作计算机界面,帮助用户从繁琐的工作中解放,专注于高价值事务。它可以:
? 了解您的需求并自动规划任务
? 智能理解屏幕内容,模拟人类视觉和操作
? 根据任务要求自主决策、判断并采取行动
? 支持本地部署,保护您的数据安全和隐私
这个开发者抛了一个 Demo:部署完 autoMate,框选微信客户端部分,给 AI 下达指令,它就能自动通过好友申请,并且给好友打标签。
这个 Case 太适合做私域营销的群体了,背后基于微软的 Omniparser + AI 大模型,可以让很多场景都能自动化。
Omniparser 是一款基于纯视觉的 AI 工具,简单来说,它像一双智能眼睛,能通过屏幕截图识别并理解电脑界面上的每一个可交互元素,比如按钮、输入框、图标等。
无论是 Windows 弹窗、网页表单、 Office 文档编辑器,还是手机 APP 界面,它都能看得明明白白,更多介绍可以看我之前发布过文章。

02

如何部署

直接下载
您可以直接从 github release 下载可执行的版本。
开源地址:https://github.com/yuruotong1/autoMate/releases/tag/v3.0
如果没办法访问这个网页,可以关注本公众号,私信 250413 获取国内可访问的下载地址。
手动部署

开发者强烈建议先安装 miniConda,并使用 miniconda 安装依赖项。网上有很多教程,或者您可以向 AI 寻求帮助。然后按照以下命令设置环境:

# Clone the project
git clone https://github.com/yuruotong1/autoMate.git
cd autoMate
# Create python3.12 environment
conda create -n "automate"python==3.12
# Activate environment
conda activate automate
# Install dependencies
python install.py

安装后,您可以使用命令行启动应用程序:

python main.py

执行成功后,在浏览器打卡 http://localhost:7888/ 配置 AI 大模型 API 密钥和基本设置。目前仅仅支持 Open AI 的底层模型,比如 o1 和 GPT-4o 。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询