mcp-selenium-server

v0.1.0

Published

4 months ago

MCP server that exposes browser automation via a Java Selenium runner

Downloads

0High
0Medium
0Low

jaisharma6

MCP Selenium Server

An MCP server that lets AI agents control a local Chrome browser via Java Selenium.

Prerequisites

Node.js >= 18
Java 17 (or higher)
Maven
Chrome installed; ensure compatible ChromeDriver is auto-managed by Selenium 4.x

Install

cd /Users/jai/MCP_Selenium
npm install
npm run java:build
npm run build

Run

Headed (visible Chrome):

npm run dev

Headless:

HEADLESS=true npm run dev

This starts the MCP server over stdio. Configure your AI client to launch node dist/server.js (or npm run dev during development) as an MCP tool server.

Publish as an npm CLI (optional)

This project can be published so projects can run with npx mcp-selenium-server.

Update version in package.json
Build artifacts:

npm run prepublishOnly

npm login
npm publish --access public

Then in any project, create mcp.json:

{
  "name": "mcp-selenium-server",
  "version": "*",
  "command": { "args": ["npx", "mcp-selenium-server"] },
  "env": { "HEADLESS": "false" }
}

Tools exposed to agents

navigate: { url } – Navigate to a URL.
click: { selector } – Click an element matched by CSS selector.
type: { selector, text } – Type text into an input/textarea/contenteditable.
wait: { ms } – Wait milliseconds.
screenshot: { path? } – Save screenshot to path (default screenshots/shot.png).

Agent context (provide to your model)

You are connected to an MCP server that controls a real Chrome browser on the user's machine using Selenium. Use the following tools to perform manual testing: navigate, click, type, wait, screenshot. Prefer robust CSS selectors. Confirm each step with a screenshot. After validating a flow manually, generate a Java Selenium JUnit test that reproduces the verified steps.

Safety: Avoid navigating to unsafe or unknown URLs. Do not download untrusted files. Ask the user before submitting forms with sensitive data.

Example manual flow

navigate { url: "https://example.com/login" }
type { selector: "#username", text: "demo" }
type { selector: "#password", text: "demoPass" }
click { selector: "button[type=submit]" }
wait { ms: 2000 }
screenshot { path: "screenshots/logged-in.png" }

Generating automation

After completing the manual flow, the agent should output a Java Selenium test skeleton (example):

// JUnit 5 test example
@Test
void login_flow() {
    ChromeOptions options = new ChromeOptions();
    WebDriver driver = new ChromeDriver(options);
    try {
        driver.get("https://example.com/login");
        driver.findElement(By.cssSelector("#username")).sendKeys("demo");
        driver.findElement(By.cssSelector("#password")).sendKeys("demoPass");
        driver.findElement(By.cssSelector("button[type=submit]")).click();
        new WebDriverWait(driver, Duration.ofSeconds(5))
            .until(d -> d.findElement(By.cssSelector(".dashboard")));
    } finally {
        driver.quit();
    }
}

Notes

Selenium 4 auto-manages ChromeDriver; ensure Chrome is installed.
Set HEADLESS=true for CI or background runs.
Screenshots are stored relative to project root by default.

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme