支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


硬核,字节一口气开源了两个类Manus智能体项目

发布日期:2025-03-26 08:36:48 浏览次数: 1626 来源:AI技术Talk
推荐语

字节跳动开源类Manus智能体项目,引领AI自动化交互新纪元。

核心内容:
1. Agent TARS:基于VLM的桌面AI Agent工具,支持自然语言控制电脑操作
2. UI-TARS Desktop:跨平台GUI自动化交互,性能优异
3. LangManus:社区驱动的AI自动化框架,涵盖任务规划、信息检索、AI计算分析等领域

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
Agent TARS:是由字节跳动开源的基于视觉语言模型(VLM)的桌面端AI Agent工具,它支持通过自然语言指令控制电脑操作,实现跨平台GUI自动化交互。
其核心功能包括自然语言控制、多模态感知与交互、自动化任务执行以及高性能与扩展性。用户可以直接输入指令,如“发送一条包含‘Hello World’的推文”或“查看旧金山天气”,模型会自动解析并执行对应的操作。此外,UI-TARS Desktop 展现了卓越的性能,在多项评估中,如OSWorld基准测试和AndroidWorld中,都取得了优异的成绩。
效果示例:清明节旅行规划
https://github.com/bytedance/UI-TARS-desktop

LangManus:是一个由社区驱动的 AI 自动化框架,它建立在开源社区的杰出工作之上。我们的目标是将语言模型与专门的工具结合起来,用于网络搜索、爬虫和 Python 代码执行等任务,同时回馈给使这一切成为可能的社区。

  • ✅ 任务规划及细分——智能划分任务,并挑选最优执行方案。 
  • ✅ 信息检索与数据抓取——能够整合Tavily、Playwright等工具,自动化地获取信息。
  • ✅ 人工智能计算与分析——利用AI模型(例如OpenAI、DeepSeek)进行数据的处理和推理分析。
  • ✅ 自动生成研究报告——依据研究需求,自动制作格式化的报告文档。

图片

效果示例

https://github.com/langmanus/langmanus

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询