微信扫码
添加专属顾问
我要投稿
UI 自动化测试,前期的开发是一方面,后期的维护也很重要,一堆的选择器和代码,内容多了时间长了让人眼花缭乱,难以维护。
今天,AI智见录
给大家推荐一个字节跳动 Web Infra 团队开源的 UI 自动化测试工具 Midscene.js[1],借助大语言模型(LLM)的超能力,你只需要输入交互步骤和期望的数据格式,Midscene.js 就能给你想要的结果。
Midscene.js 提供了 JavaScript 版本的 SDK,可以让你使用自然语言控制页面、执行断言并以 JSON 格式提取数据,当前已在 Github 开源,Star 669。
Midscene.js 当前已发布到 NPM,JavaScirpt 开发者可以通过代码快速接入。
核心 API 主要以下几个:
.aiAction(steps: string)
:描述你要执行的一系列步骤,例如:“.aiAction("搜索栏输入 ‘今天天气怎么样’,点击搜索按钮")
”.ai()
:.ai 是 .aiAction 的简写.aiQuery(dataShape: any)
:从页面提取数据,例如:.aiQuery('左上角展示的日期和时间,string')
.aiAssert(assertion: string, errorMsg?: string)
:断言Midscene.js 提供了 Chrome 插件,让用户方便的在任意网站上进行体验,而无需编写代码。
Chrome 应用商店输入名字 Midscene.js[2] 搜索到如下插件。
插件安装成功后,找一个你喜欢的网站,打开 Midscene.js 插件,第一步需要先配置 OpenAI API Key,之后在输入框内输入你要描述的步骤。
Puppeteer[3] 是一个 JavaScript 库,它通过 DevTools 协议或 WebDriver BiDi 提供了一个高级 API 来控制 Chrome 或 Firefox。
Midscene.js 提供了 PuppeteerAgent,实现了与 Puppeteer 的集成。
配置 API Key
OPENAI_API_KEY="替换为自己的 Open API Key"
安装依赖
npm install @midscene/web puppeteer ts-node --save-dev
示例
以下是 Midscene.js 提供的 与 Puppeteer 集成示例[4]
import puppeteer from "puppeteer";
import { PuppeteerAgent } from "@midscene/web/puppeteer";
const sleep = (ms: number) => new Promise((r) => setTimeout(r, ms));
Promise.resolve(
(async () => {
const browser = await puppeteer.launch({
headless: false, // here we use headed mode to help debug
});
const page = await browser.newPage();
await page.setViewport({
width: 1280,
height: 800,
deviceScaleFactor: 1,
});
await page.goto("https://www.ebay.com");
await sleep(5000);
// ? 初始化 Midscene agent
const mid = new PuppeteerAgent(page);
// ? 执行搜索
// 注:尽管这是一个英文页面,你也可以用中文指令控制它
await mid.aiAction('在搜索框输入 "Headphones" ,敲回车');
await sleep(5000);
// ? 理解页面,提取数据
const items = await mid.aiQuery(
'{itemTitle: string, price: Number}[], 找到列表里的商品标题和价格',
);
console.log("耳机商品信息", items);
// ? 用 AI 断言
await mid.aiAssert("界面左侧有类目筛选功能");
await browser.close();
})()
);
这样写测试用例看起来是不是超级方便?感兴趣的小伙伴可以试试哦!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-17
苹果 macOS 本地部署最新 GPT-5 CodeX,网友集体抛弃 Claude Code
2025-09-17
腾讯开源了个知识库系统,在飞牛NAS上部署玩玩!
2025-09-17
Qwen3-Next 首测!Qwen3.5的预览版?但为什么我的测试一塌糊涂?
2025-09-17
Microsoft 推出用于更长对话式 AI 音频的 VibeVoice 且开源
2025-09-16
[开源]Docling:AI时代的全能文档处理引擎
2025-09-15
如何使用 SGLang 部署 LongCat-Flash 模型
2025-09-14
我的个人管理系统只有一个Markdown:实战篇,我把Prompt开源了,照着SOP做
2025-09-12
3000字长文:基于Dify的公司制度检索问答Agent实践
2025-07-23
2025-08-20
2025-09-07
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12
2025-07-31
2025-09-17
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13
2025-08-11