MCP(模型上下文协议)
它能做什么?
WebdriverIO MCP 是一个模型上下文协议(MCP)服务器,使 Claude Desktop 和 Claude Code 等 AI 助手能够自动化并与网络浏览器和移动应用程序交互。
为什么选择 WebdriverIO MCP?
- 移动优先:不同于仅支持浏览器的 MCP 服务器,WebdriverIO MCP 通过 Appium 支持 iOS 和 Android 原生应用自动化
- 跨平台选择器:智能元素检测自动生成多种定位策略(可访问性 ID、XPath、UiAutomator、iOS 谓词)
- WebdriverIO 生态系统:基于经过实战检验的 WebdriverIO 框架,拥有丰富的服务和报告生态系统
它为以下平台提供了统一的接口:
- 🖥️ 桌面浏览器(Chrome - 有头或无头模式)
- 📱 原生移动应用(iOS 模拟器 / Android 模拟器 / 通过 Appium 连接的真机)
- 📳 混合移动应用(通过 Appium 在原生和 WebView 上下文之间切换)
通过 @wdio/mcp 包实现。
这使得 AI 助手能够:
- 启动和控制浏览器,可配置尺寸、无头模式和可选的初始导航
- 浏览网站并与元素交互(点击、输入、滚动)
- 分析页面内容,通过可访问性树和可见元素检测(支持分页)
- 截图自动优化(调整大小、压缩至最大 1MB)
- 管理 cookies 用于会话处理
- 控制移动设备,包括手势(点击、滑动、拖放)
- 在混合应用中切换上下文,在原生和 webview 之间切换
- 执行脚本 - 浏览器中的 JavaScript,设备上的 Appium 移动命令
- 处理设备功能,如旋转、键盘、地理位置
- 以及更多功能,请参阅工具和配置选项
信息
注意:对于移动应用 移动自动化需要运行中的 Appium 服务器,并安装适当的驱动程序。请参阅先决条件获取设置说明。