微信扫码
添加专属顾问
我要投稿
利用DeepSeek实现AI自动化浏览器操作,大幅提升网页抓取、自动化测试和数据收集效率。 核心内容: 1. DeepSeek模型结合browser-use工具的介绍 2. 安装依赖和编写测试脚本的步骤 3. 利用AI Agent自动化获取新闻资讯的示例
如果能够通过大模型自动操作浏览器,无论是网页抓取、自动化测试还是数据收集都能大大提高效率。
因为你无须编写和维护复杂的xpath、正则、css选择器脚本。今天,喵将介绍一个非常有趣的工具——browser-use[1],并结合 DeepSeek
模型,展示通过 AI Agent自动化操作浏览器。
首先,你需要确保有一个基础的Python 环境,Python版本要大于3.11。
pip install browser-use
playwright install
browser-use
官方推荐使用 GPT-4 模型,但为了降低成本,我们可以使用 DeepSeek
。官方的有点卡,我这里使用的是硅基流动的deepseek-ai/DeepSeek-V2.5
接下来,我们可以编写一个简单的 Python 脚本来测试 browser-use
的功能。以下是一个示例脚本,用于获取财联社电报的前十条新闻资讯:
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
if __name__ == '__main__':
llm = ChatOpenAI(model="deepseek-ai/DeepSeek-V2.5", api_key="api-key", base_url="https://api.siliconflow.cn")
asyncdefmain():
agent = Agent(
task="打开财联社https://www.cls.cn/telegraph,获取前十条资讯",
llm=llm,
use_vision=False,
)
result = await agent.run()
print(result)
asyncio.run(main())
运行上述脚本后,browser-use
会自动打开浏览器,访问指定的财联社地址,并获取前十条资讯。结果将打印在控制台中。
下面是browser-use获取到的数据,并且自动转为了json格式,对于抓取数据可谓是相当友好了。
注意: 本文中的示例代码和配置仅供参考,实际使用时请根据你的需求进行调整
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-06
我让DeepSeek设计了一个智能运维平台
2025-03-06
一个指令完成所有工作!Manus AI 预示了未来几年Agent的疯狂发展
2025-03-06
华为昇腾DeepSeek一体机深度拆解(附核心标的)
2025-03-05
DeepSeek 给 API 网关上了一波热度
2025-03-05
DeepSeek时代:关于AI服务器的技术思考(PCIe篇)
2025-03-04
详细版教程|使用 Higress AI 网关,4步实现 DeepSeek 联网搜索功能
2025-03-04
使用 Nginx 对 LLM 服务进行负载均衡实践
2025-03-04
AI全息透明显示音箱,会是音箱市场的“哪吒”吗?
2024-03-30
2024-05-09
2024-07-07
2024-07-23
2024-06-23
2024-07-01
2024-06-24
2024-10-20
2024-06-08
2024-12-29