MCP (모델 컨텍스트 프로토콜)
무엇을 할 수 있나요?
WebdriverIO MCP는 Claude Desktop 및 Claude Code와 같은 AI 어시스턴트가 웹 브라우저 및 모바일 애플리케이션을 자동화하고 상호작용할 수 있게 해주는 모델 컨텍스트 프로토콜(MCP) 서버입니다.
WebdriverIO MCP를 사용하는 이유?
- 모바일 우선: 브라우저 전용 MCP 서버와 달리, WebdriverIO MCP는 Appium을 통한 iOS 및 Android 네이티브 앱 자동화를 지원합니다
- 크로스 플랫폼 셀렉터: 스마트 요소 감지 기능이 여러 위치 지정 전략(접근성 ID, XPath, UiAutomator, iOS predicates)을 자동으로 생성합니다
- WebdriverIO 생태계: 풍부한 서비스 및 리포터 생태계를 갖춘 검증된 WebdriverIO 프레임워크를 기반으로 구축되었습니다
다음에 대한 통합 인터페이스를 제공합니다:
- 🖥️ 데스크톱 브라우저(Chrome - 헤드 또는 헤드리스 모드)
- 📱 네이티브 모바일 앱(Appium을 통한 iOS 시뮬레이터 / Android 에뮬레이터 / 실제 기기)
- 📳 하이브리드 모바일 앱(Appium을 통한 네이티브 + WebView 컨텍스트 전환)
@wdio/mcp 패키지를 통해 제공됩니다.
이를 통해 AI 어시스턴트는 다음을 수행할 수 있습니다:
- 브라우저 실행 및 제어 - 구성 가능한 크기, 헤드리스 모드, 선택적 초기 탐색 기능 제공
- 웹사이트 탐색 및 요소와 상호작용(클릭, 입력, 스크롤)
- 페이지 콘텐츠 분석 - 접근성 트리 와 페이지네이션 지원이 있는 가시적 요소 감지
- 스크린샷 촬영 - 자동 최적화(크기 조정, 최대 1MB로 압축)
- 세션 처리를 위한 쿠키 관리
- 모바일 기기 제어 - 제스처 포함(탭, 스와이프, 드래그 앤 드롭)
- 하이브리드 앱에서 네이티브와 웹뷰 간 컨텍스트 전환
- 스크립트 실행 - 브라우저에서 JavaScript, 기기에서 Appium 모바일 명령
- 회전, 키보드, 지오로케이션과 같은 기기 기능 처리
- 그리고 더 많은 기능은 도구와 구성 옵션을 참조하세요
정보
모바일 앱 참고사항 모바일 자동화는 적절한 드라이버가 설치된 실행 중인 Appium 서버가 필요합니다. 설정 지침은 전제 조건을 참조하세요.
설치
@wdio/mcp를 사용하는 가장 쉬운 방법은 로컬 설치 없이 npx를 통하는 것입니다:
npx @wdio/mcp
또는 전역으로 설치:
npm install -g @wdio/mcp
Claude에서 사용하기
Claude에서 WebdriverIO MCP를 사용하려면 구성 파일을 수정하세요:
{
"mcpServers": {
"wdio-mcp": {
"command": "npx",
"args": ["-y", "@wdio/mcp"]
}
}
}
구성을 추가한 후 Claude를 재시작하세요. WebdriverIO MCP 도구를 브라우저 및 모바일 자동화 작업에 사용할 수 있게 됩니다.
Claude Code에서 사용하기
Claude Code는 자동으로 MCP 서버를 감지합니다. 프로젝트의 .claude/settings.json 또는 .mcp.json에서 구성할 수 있습니다.
또는 다음을 실행하여 .claude.json에 전역으로 추가하세요:
claude mcp add --transport stdio wdio-mcp -- npx -y @wdio/mcp
claude code 내에서 /mcp 명령을 실행하여 검증하세요.
빠른 시작 예제
브라우저 자동화
Claude에게 브라우저 작업을 자동화하도록 요청하세요:
"Chrome을 열고 https://webdriver.io로 이동"
"'Get Started' 버튼 클릭"
"페이지 스크린샷 촬영"
"페이지의 모든 보이는 링크 찾기"
모바일 앱 자동화
Claude에게 모바일 앱 자동화를 요청하세요:
"iPhone 15 시뮬레이터에서 iOS 앱 시작"
"로그인 버튼 탭하기"
"위로 스와이프하여 아래로 스크롤"
"현재 화면의 스크린샷 촬영"
기능
브라우저 자동화(Chrome)
| 기능 | 설명 |
|---|---|
| 세션 관리 | 헤드/헤드리스 모드로 Chrome 실행, 사용자 정의 크기 및 선택적 탐색 URL 지원 |
| 탐색 | URL로 이동 |
| 요소 상호작용 | 요소 클릭, 텍스트 입력, 다양한 셀렉터로 요소 찾기 |
| 페이지 분석 | 보이는 요소 가져오기(페이지네이션 포함), 접근성 트리(필터링 포함) |
| 스크린샷 | 스크린샷 캡처(최대 1MB로 자동 최적화) |
| 스크롤링 | 구성 가능한 픽셀 양만큼 위/아래로 스크롤 |
| 쿠키 관리 | 쿠키 가져오기, 설정, 삭제 |
| 스크립트 실행 | 브라우저 컨텍스트에서 사용자 정의 JavaScript 실행 |