web-doc-mcp
v0.0.2
Published
mcp-test MCP server
Readme
Web Doc MCP
一个基于 Model Context Protocol (MCP) 的网页文档获取服务器,使用 mcp-framework 构建。
项目简介
Web Doc MCP 是一个专门用于获取网页文档内容的 MCP 服务器,目前支持钉钉文档的自动下载和内容提取。该工具可以自动化浏览器操作,获取文档内容并转换为 Markdown 格式。
主要功能
- 钉钉文档支持: 自动访问钉钉文档页面,提取文档内容
- 多种传输模式: 支持 stdio、SSE、HTTP-stream 三种传输方式
- 智能缓存: 自动缓存文档内容,避免重复下载
- Cookie 管理: 自动管理登录状态和 Cookie 信息
- 日志记录: 完整的操作日志记录,便于调试和监控
配置示例
在 Claude Desktop 中配置
MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%/Claude/claude_desktop_config.json
{
"mcpServers": {
"web-doc-mcp": {
"command": "npx",
"args": ["web-doc-mcp", "--cachepath=E://cache"]
}
}
}在 Cursor 中配置
Windows: %APPDATA%/Cursor/mcp.json
MacOS: ~/Library/Application Support/Cursor/mcp.json
{
"mcpServers": {
"web-doc-mcp": {
"command": "npx",
"args": ["web-doc-mcp", "--cachepath=E://cache"]
}
}
}使用 SSE 传输模式(本地运行)
{
"mcpServers": {
"web-doc-mcp": {
"url": "http://127.0.0.1:9878/sse"
}
}
}配置选项
命令行参数
--stdio: 使用 stdio 传输模式(默认)--sse: 使用 SSE 传输模式--http: 使用 HTTP-stream 传输模式--port <number>: 设置端口号(默认: 9878)--showbrowser: 显示浏览器界面(调试用)--closelog: 关闭日志输出(默认: true)--clearlog <days>: 清理指定天数前的日志(0 表示清理所有)--clearmd <days>: 清理指定天数前的 Markdown 缓存(0 表示清理所有)--cachepath <path>: 设置缓存路径(绝对路径)
安装和使用
方式一:使用 npm 包(推荐)
# 全局安装
npm install -g web-doc-mcp
# 或使用 npx 直接运行
npx web-doc-mcp方式二:从源码构建
# 克隆项目
git clone https://github.com/your-username/web-doc-mcp.git
cd web-doc-mcp
# 安装依赖
npm install
# 构建项目
npm run build
# 启动服务
npm start故障排除
常见问题
- 浏览器启动失败: 检查系统是否安装了 Chrome 或 Chromium
- 登录失败: Cookie 可能已过期,删除
cookie.json文件重新登录 - 文档获取失败: 检查网络连接和文档权限
了解更多
许可证
MIT License
