MCP协议:标准化AI与工具的“对话”
MCP协议通过定义统一的通信标准,让LLM能够无缝调用外部工具(如浏览器、数据库、本地文件)。其核心价值体现在:
标准化交互:开发者只需实现一次MCP Server,即可适配所有支持MCP的客户端(如WindSurf、Cline)。
动态灵活性:支持实时生成指令,例如根据页面状态动态调整操作流程。
安全性:内置权限控制,防止LLM越权访问敏感数据。
以Playwright的MCP Server为例,其工作流程如下:
指令接收:LLM发送自然语言描述(如“点击登录按钮”)。
指令解析:将自然语言转化为Playwright的API调用(如page.click("#login"))。
结果返回:将操作结果(截图、日志等)反馈给LLM。
Playwright+mcp如何实现浏览器自动化?接下来带着大家去体验下。
环境搭建
安装Python环境
:确保Python版本≥3.7(推荐3.8+)
pip install playwright
python -m playwright install
#版本不匹配
playwright install --force chrome
安装Playwright Test for VSCode插件
:
在VS Code扩展商店搜索并安装"Playwright Test for VSCode"
部署MCP Server:
npx @playwright/mcp@latest
#或者
npm install -g @playwright/mcp
启动
npx @playwright/mcp@latest
客户端配置(以VSCode Cline为例)
安装Cline插件
安装后
直接执行
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
勾选这这个
然后点击右上角
点击installed
配置:
配置启动参数:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
如果链接不上去可以
{
"mcpServers": {
"memory": {
"command": "cmd",
"args": [
"/c",
"npx",
"-y",
"@playwright/mcp@latest"
],
"timeout": 300
}
}
}
然后输入允运行后,可以看到已经链接成功,有这么多tools
然后就可以在本地进行测试了
备注,如果没有大模型可以参考:配置国内开源的。
配置后体验。在对话框输入了一段话:打开百度,搜索你好,并且截图。
看下模型怎么给我们出来的,拆分了步骤,并且生成了playwright mcp服务端可以执行的对应的步骤,然后进行执行,目前每执行一步都会让你确认。
上面是微软的,但是感觉微软的封装的没有那么多。网上还有一个
https://github.com/executeautomation/mcp-playwright安装方式如下
npm install -g @executeautomation/playwright-mcp-server
配置
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["-y", "@executeautomation/playwright-mcp-server"]
}
}
}
如果启动有问题,可以试下下面的启动方式
"mcpServers": {
"@executeautomation-playwright-mcp-server": {
"command": "node.exe",
"args": [
"你的路径/node_modules/@executeautomation/playwright-mcp-server/dist/index.js",
"-y",
"@smithery/cli@latest",
"run",
"@executeautomation/playwright-mcp-server",
"--config",
"\"{}\""
]
}
}
}
这个配置后,大概有,封装的更完善
有了playwright-mcp,可以让浏览器自动化变成了特别简单的AI对话,人人都可以写浏览器自动化,部署后,开发写完代码,本地就可以进行简单的对话来验证是否完成,产品验收也只需要简单的AI对话即可实现,测试工程师,也不再编写复杂的代码,即可通过对话AI实现浏览器自动化。后续会有更多的版本迭代,越来越简单。AI时代,mcp加持下,人人都是AI时代的工具人。