支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


字节跳动开源了一套比Manus更强大的Agent:TARS

发布日期:2025-03-20 22:52:14 浏览次数: 1651 来源:字节笔记本
推荐语

字节跳动最新开源AI代理TARS,功能强大超越Manus,助力深度研究和复杂工作流。

核心内容:
1. TARS的多模态特性及与网页、命令行的无缝集成
2. 高级浏览器操作与全面工具支持,提升工作流效率
3. 开发者友好的框架设计,简化集成和自定义工作流创建

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

Agent TARS是一款开源的多模态AI代理,它能够通过视觉解析网页内容,并与命令行和文件系统无缝集成。还适合于深度研究、操作系统功能,复杂工作流。

189f7bf9-cb6e-4f5f-bcd5-7b3161ee2b99.png

主要特点上比Manus更加的强大:

  • 高级浏览器操作:通过代理框架执行深度研究和操作功能等复杂任务,实现全面的规划和执行。
  • 全面工具支持:集成搜索、文件编辑、命令行和模型上下文协议(MCP)工具,处理复杂工作流。
  • 增强桌面应用:全新UI设计,包括浏览器显示、多模态元素、会话管理、模型配置、对话流可视化以及浏览器/搜索状态跟踪。
  • 工作流编排:无缝连接GUI代理工具——搜索、浏览、探索链接,并将信息合成为最终输出。
  • 开发者友好框架:简化与UI-TARS的集成和GUI代理项目的自定义工作流创建。

Agent TARS使用

必要配置

在开始之前,需要进行一些必要的配置。

点击左下角按钮打开配置页面:

       ded04a1c-e9cd-4599-99e2-03a065a44d6c.png            

然后就可以设置模型配置和搜索配置了。

对于模型配置,你可以设置模型提供商和API密钥:

1ddcc5e1-e3f9-4ece-a83e-5d3c9a705ed9.png

对于Azure OpenAI,可以设置更多参数,包括apiVersion、deploymentName和endpoint。

对于搜索配置,可以设置搜索提供商和API密钥:

2d58d5d2-c22e-4803-ada8-fe28f22633e3.png             

在输入框中直接输入任务。TARS还支持Human In the Loop,意味可以通过输入框在工作过程中与代理交互。

如果想改变当前代理工作的方向,你可以在顶部位置的特殊输入框中插入新的想法,然后按回车键发送。

a512305b-6b8a-4816-9337-605dd35169ad.png

同时可以通过顶部菜单上的分享按钮与他人分享对话。   

3f06a699-c859-4a6d-8255-da6b857e47f3.png              

Agent TARS采用Apache License 2.0许可。地址:

https://github.com/bytedance/UI-TARS-desktop/tree/main/apps/agent-tars

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询