AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


star 34.6k!通过DeepSeek实现AI自动化操作浏览器!

发布日期:2025-03-05 16:27:22 浏览次数: 1594 来源:喵开发
推荐语

利用DeepSeek实现AI自动化浏览器操作,大幅提升网页抓取、自动化测试和数据收集效率。

核心内容:
1. DeepSeek模型结合browser-use工具的介绍
2. 安装依赖和编写测试脚本的步骤
3. 利用AI Agent自动化获取新闻资讯的示例

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

如果能够通过大模型自动操作浏览器,无论是网页抓取、自动化测试还是数据收集都能大大提高效率。

因为你无须编写和维护复杂的xpath、正则、css选择器脚本。今天,喵将介绍一个非常有趣的工具——browser-use[1],并结合 DeepSeek 模型,展示通过 AI Agent自动化操作浏览器。

开始使用

1. 安装依赖

首先,你需要确保有一个基础的Python 环境,Python版本要大于3.11。

pip install browser-use
playwright install

2. 编写测试脚本

browser-use 官方推荐使用 GPT-4 模型,但为了降低成本,我们可以使用 DeepSeek 。官方的有点卡,我这里使用的是硅基流动的deepseek-ai/DeepSeek-V2.5

接下来,我们可以编写一个简单的 Python 脚本来测试 browser-use 的功能。以下是一个示例脚本,用于获取财联社电报的前十条新闻资讯:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

if __name__ == '__main__':
    llm = ChatOpenAI(model="deepseek-ai/DeepSeek-V2.5", api_key="api-key", base_url="https://api.siliconflow.cn")
    asyncdefmain():
        agent = Agent(
            task="打开财联社https://www.cls.cn/telegraph,获取前十条资讯",
            llm=llm,
            use_vision=False,
        )
        result = await agent.run()
        print(result)

    asyncio.run(main())

3. 运行脚本并查看结果

运行上述脚本后,browser-use 会自动打开浏览器,访问指定的财联社地址,并获取前十条资讯。结果将打印在控制台中。

下面是browser-use获取到的数据,并且自动转为了json格式,对于抓取数据可谓是相当友好了。

注意: 本文中的示例代码和配置仅供参考,实际使用时请根据你的需求进行调整

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询