微信扫码
与创始人交个朋友
我要投稿
什么是视觉AI测试?
视觉测试可以理解为功能测试的一种特殊形式。通过视觉测试,断言等方式检测被测试应用或系统UI的视觉变化。而这些视觉AI解决方案可以使用视觉人工智能(Visual AI)来发现像缺失元素、扭曲布局和重叠文本这样的漏洞,这些问题常常被传统的自动化技术所忽视。本文以AI视觉测试解决方案applitools为载体进行讲解
Applitools是如何工作的?
测试是交互加上验证。测试用例步骤仅仅是进行操作并确保其正常工作的过程。在传统的断言中,测试通常需要从页面中抓取元素,然后验证元素属性,如文本值或可见性。一个测试需要多次调用来检查不同的元素。不幸的是,元素选择器可能很难编写,并且在页面更改时容易中断。它们也无法捕捉页面的所有视觉方面,如布局、颜色、大小和位置。
视觉快照是一种更为全面、稳健的测试UI的方法。与编写多个冗长的断言相比,你只需编写一行代码调用,就可以捕获页面上的所有内容的视觉快照。快照不仅仅是静态图像:它捕捉了组成页面的所有HTML、CSS和JavaScript。
视觉测试只是使用视觉快照进行断言的测试。Applitools提供了用于多种测试工具和框架(如Selenium、Cypress和Playwright)的Eyes SDK,用于捕获视觉快照。第一次运行测试时,Applitools Eyes会将初始快照作为基准图像上传到云端。然后,每次再次运行测试时,Applitools会捕获一个新的快照,称为检查点图像,并在云端使用视觉人工智能检测任何有意义的差异。
实际案例演示
本文将以Python+Selenium+Applitools Eyes SDK进行演示视觉AI测试。以Applitools官方提供的代码库为基础进行演示。步骤如下:
首先需要注册Applitools账号,账号注册完成后,会自动分配一个API key. 注册账号地址为:https://auth.applitools.com/users/register
可以从如下截图处获取API Key,(API key会在后续的步骤中使用)。
打开Github代码库:https://github.com/applitools/example-selenium-python-pytest
克隆代码到本地,并进入到项目主目录。
准备Python开发环境,最好是虚拟环境。
准备好最新版本的Chrome浏览器,并下载适配的chrome driver.
安装需要的Python类库,通过如下命令:
pip install -r requirements.txt
设置个人账号的API Key. 文件在conftest.py
可以通过执行如下命令,执行测试。
python3 -m pytest -s -v tests
测试完成后,会在控制台有如下的日志。
测试完成之后,可以通过点击控制台上的see details里面的链接进入到applitools eye捕获到的测试细节,特别是对UI的捕捉的细节。具体如下图:
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-20
探索新一代大模型代理(LLM agent)及其架构
2024-09-20
阿里 mPLUG-Owl3 震撼登场:通用多模态大模型的创新风暴来袭
2024-09-20
Llama 3.1 Omni:颠覆性的文本与语音双输出模型
2024-09-18
阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80%
2024-09-16
Mac上运行微软最新Phi-3.5-mini大模型+开发Agent
2024-09-12
GPT-4 和 GPT-4o的主要区别
2024-09-10
使用 Dify 和 AI 大模型理解视频内容:Qwen 2 VL 72B
2024-09-10
语音识别大赛五连冠!开会就能用!
2024-06-17
2024-07-11
2024-06-17
2024-08-06
2024-04-21
2024-08-30
2024-07-11
2024-06-26
2024-07-15
2024-07-07
2024-09-01
2024-07-31
2024-07-25
2024-07-19
2024-07-15
2024-07-15
2024-07-14
2024-07-14