@wengine-ai/mcp-visual
v1.0.5
Published
WEngine Visual MCP Server - 图像识别与分析工具
Maintainers
Readme
@wengine-ai/mcp-visual
Wengine Visual MCP Server - 基于 Model Context Protocol 的图像识别与分析工具。
功能特性
- 图像分析 (
analyze_image): 分析图像内容,返回描述和标签 - 文字识别 (
extract_text): 从图像中提取文字内容(OCR),复用视觉模型 - 对象检测 (
detect_objects): 检测图像中的对象并返回位置坐标 - 图像比较 (
compare_images): 比较两张图像的相似度和差异
安装与运行
使用 npx(推荐)
npx @wengine-ai/mcp-visual本地开发
cd wengine-mcp-visual
npm install
npm run dev # 开发模式
npm run build # 构建
npm start # 运行配置
详细的配置说明请参阅 CONFIGURATION.md。
工具说明
analyze_image
分析图像内容,返回描述和标签。
参数:
image_path(必需): 图像文件路径,支持本地路径和远程 URLprompt(可选): 分析提示词
extract_text
从图像中提取文字内容(OCR)。无需额外配置,直接复用视觉模型完成 OCR。
参数:
image_path(必需): 图像文件路径
detect_objects
检测图像中的对象并返回位置坐标。
参数:
image_path(必需): 图像文件路径target(可选): 要检测的目标类型
compare_images
比较两张图像的相似度和差异。
参数:
image_path_1(必需): 第一张图像路径image_path_2(必需): 第二张图像路径
许可证
MIT License
