@leviathangk/playwright-mcp

v0.1.0

Published

a month ago

MCP server for browser automation and web scraping using Playwright. Supports network capture, page understanding, and AI-driven web interaction.

0High
0Medium
0Low

leviathangk

mcp playwright browser-automation model-context-protocol web-scraping crawler network-capture ai-automation

Playwright MCP Server

基于 Playwright 的 Model Context Protocol (MCP) 服务器，提供浏览器自动化功能。

功能特性

会话管理：创建和管理多个独立的浏览器会话
并发支持：支持多个并发浏览器会话，自动清理过期会话
浏览器操作：导航、点击、输入等常用操作
灵活配置：支持不同浏览器（Chromium、Firefox、WebKit）和模式（有头/无头）
自动清理：会话超时后自动清理资源

安装

npm install

启动方式

方式 1：开发模式（推荐用于测试）

使用默认配置启动：

npm run dev

使用自定义参数启动：

npm run dev --browser chromium --headless false --executable-path "C:\Program Files\Google\Chrome\Application\chrome.exe"

方式 2：生产模式

npm run build
npm start

方式 3：MCP 配置文件

在 MCP 配置文件（如 .kiro/settings/mcp.json）中添加：

使用 Playwright 自带浏览器：

{
  "mcpServers": {
    "playwright": {
      "command": "node",
      "args": [
        "E:/Project/MyProject/PlaywrightMCPForCrawler/build/index.js",
        "--browser", "chromium",
        "--headless", "false",
        "--session-timeout", "300000",
        "--max-sessions", "10"
      ]
    }
  }
}

使用本地 Chrome 浏览器（无需 playwright install）：

{
  "mcpServers": {
    "playwright": {
      "command": "node",
      "args": [
        "E:/Project/MyProject/PlaywrightMCPForCrawler/build/index.js",
        "--browser", "chromium",
        "--executable-path", "C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe",
        "--headless", "false",
        "--session-timeout", "600000",
        "--max-sessions", "5"
      ]
    }
  }
}

配置参数

| 参数 | 类型 | 默认值 | 说明 | |------|------|--------|------| | --browser | string | chromium | 浏览器类型：chromium、firefox 或 webkit | | --headless | boolean | false | 是否使用无头模式（true/false） | | --session-timeout | number | 300000 | 会话超时时间（毫秒），默认 5 分钟 | | --max-sessions | number | 10 | 最大并发会话数 | | --max-network-requests | number | 1000 | 每个会话最多保存的网络请求数 | | --executable-path | string | 无 | 浏览器可执行文件路径（可选）。如不指定则使用 Playwright 自带浏览器 |

常见浏览器路径

Windows:

Chrome: C:\Program Files\Google\Chrome\Application\chrome.exe
Edge: C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe

macOS:

Chrome: /Applications/Google Chrome.app/Contents/MacOS/Google Chrome
Edge: /Applications/Microsoft Edge.app/Contents/MacOS/Microsoft Edge

Linux:

Chrome: /usr/bin/google-chrome
Chromium: /usr/bin/chromium-browser

完整示例

示例 1：开发测试（使用本地 Chrome）

npm run dev -- --executable-path "C:\Program Files\Google\Chrome\Application\chrome.exe" --headless false

示例 2：MCP 配置（最小配置）

{
  "mcpServers": {
    "playwright": {
      "command": "node",
      "args": ["E:/Project/MyProject/PlaywrightMCPForCrawler/build/index.js"]
    }
  }
}

示例 3：MCP 配置（完整配置）

{
  "mcpServers": {
    "playwright": {
      "command": "node",
      "args": [
        "E:/Project/MyProject/PlaywrightMCPForCrawler/build/index.js",
        "--browser", "chromium",
        "--executable-path", "C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe",
        "--headless", "false",
        "--session-timeout", "600000",
        "--max-sessions", "5"
      ]
    }
  }
}

可用工具

基础操作

create_session

创建新的浏览器会话。会话创建后会自动开始捕获所有网络请求。

返回值：

sessionId：唯一会话标识符
expiresAt：会话过期时间戳

close_session

关闭现有浏览器会话。

参数：

sessionId（必需）：要关闭的会话 ID

navigate

在指定会话中导航到 URL。

参数：

sessionId（必需）：会话 ID
url（必需）：要导航到的 URL
waitUntil（可选）：何时认为导航成功（load、domcontentloaded、networkidle）
timeout（可选）：导航超时时间（毫秒）

返回值：

success：导航是否成功
title：页面标题
url：最终 URL（重定向后）
status：HTTP 状态码

click

点击页面上的元素。

参数：

sessionId（必需）：会话 ID
selector（必需）：元素的 CSS 选择器或 XPath
timeout（可选）：超时时间（毫秒）
force（可选）：即使元素不可操作也强制点击
clickCount（可选）：点击次数（默认：1）

type

在输入元素中输入文本。

参数：

sessionId（必需）：会话 ID
selector（必需）：输入元素的 CSS 选择器或 XPath
text（必需）：要输入的文本
delay（可选）：按键之间的延迟（毫秒）
timeout（可选）：超时时间（毫秒）
clear（可选）：输入前是否清空（默认：false）

网络请求捕获（爬虫专用）

会话创建后会自动捕获所有网络请求，无需手动开启。非常适合爬虫场景：打开页面后直接搜索关键词定位 API。

search_requests

根据关键词搜索网络请求（支持正则表达式）。

参数：

sessionId（必需）：会话 ID
keyword（必需）：搜索关键词
searchIn（可选）：搜索范围，数组：['url', 'request', 'response']，默认 ['url', 'response']
isRegex（可选）：是否使用正则表达式，默认 false
limit（可选）：返回结果数量，默认 10

返回值：

total：匹配总数
returned：返回数量
matches：匹配结果数组
- id：请求 ID
- url：请求 URL
- method：HTTP 方法
- matchedIn：匹配位置（url/request/response）
- matchedText：匹配的文本片段
- curl：curl 命令
- request：请求详情
- response：响应详情

使用示例：

// 搜索响应中包含"用户列表"的 API
await callTool('search_requests', {
  sessionId: sessionId,
  keyword: '用户列表',
  searchIn: ['response']
});

// 使用正则搜索所有 /api/ 开头的请求
await callTool('search_requests', {
  sessionId: sessionId,
  keyword: '^https://.*\\/api\\/',
  searchIn: ['url'],
  isRegex: true
});

get_requests

获取所有捕获的网络请求（可选过滤）。

参数：

sessionId（必需）：会话 ID
filter（可选）：过滤条件
- method：HTTP 方法（GET、POST 等）
- urlContains：URL 包含的字符串
- resourceType：资源类型（xhr、fetch、document 等）
- statusCode：HTTP 状态码
limit（可选）：返回数量，默认 50

返回值：

total：总请求数
returned：返回数量
requests：请求列表（简化信息）

get_request_detail

获取单个请求的完整详情，包括 curl 命令。

参数：

sessionId（必需）：会话 ID
requestId（必需）：请求 ID（从 search_requests 或 get_requests 获取）

返回值：

完整的请求和响应信息
curl：可直接执行的 curl 命令

clear_requests

清空会话的网络请求历史（用于长时间运行的会话）。

参数：

sessionId（必需）：会话 ID

错误处理

所有操作返回结构化的错误响应：

errorCode：机器可读的错误代码
message：人类可读的错误描述
sessionId：会话 ID（如适用）
details：额外的错误上下文（如可用）

错误代码

SESSION_NOT_FOUND：会话不存在
SESSION_EXPIRED：会话已过期
MAX_SESSIONS_REACHED：达到最大会话限制
NAVIGATION_FAILED：导航操作失败
ELEMENT_NOT_FOUND：页面上未找到元素
ELEMENT_NOT_CLICKABLE：元素不可点击
ELEMENT_NOT_EDITABLE：元素不可编辑
BROWSER_ERROR：浏览器级别错误
INVALID_PARAMETERS：提供的参数无效

开发

# 安装依赖
npm install

# 编译
npm run build

# 运行测试
npm test

# 启动服务器
npm start

许可证

MIT

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme

Playwright MCP Server

功能特性

安装

启动方式

方式 1：开发模式（推荐用于测试）

方式 2：生产模式

方式 3：MCP 配置文件

配置参数

常见浏览器路径

完整示例

示例 1：开发测试（使用本地 Chrome）

示例 2：MCP 配置（最小配置）

示例 3：MCP 配置（完整配置）

可用工具

基础操作

create_session

close_session

navigate

click

type

网络请求捕获（爬虫专用）

search_requests

get_requests

get_request_detail

clear_requests

错误处理

错误代码

开发

许可证