bailian-image-understanding-mcp
v1.0.1
Published
阿里云百炼通义千问Qwen-VL图片内容理解MCP工具
Maintainers
Readme
百炼图片理解 MCP 服务器
让 Claude 能"看懂"图片的 MCP 工具,基于阿里云通义千问 VL 模型。
为什么需要这个工具
Claude 本身不具备视觉能力,通过这个 MCP 服务器,你可以:
- 发送图片链接或本地图片给 Claude 分析
- 截图后直接粘贴,让 Claude 解释内容
- 处理 base64 编码的图片数据
支持的模型:
- qwen-vl-plus(默认):性价比之选
- qwen3-vl-plus:第二代,性能更强
- qwen-vl-max:最强能力,适合复杂场景
安装配置
1. 获取 API Key
访问 阿里云百炼平台,开通大模型推理服务后创建 API Key。
2. 配置 Claude Desktop
编辑 ~/Library/Application Support/Claude/claude_desktop_config.json:
{
"mcpServers": {
"bailian-image": {
"command": "npx",
"args": ["bailian-image-understanding-mcp"],
"env": {
"DASHSCOPE_API_KEY": "你的API密钥",
"QWEN_VISION_MODEL": "千问模型code",
"BAILIAN_REGION": "cn-hangzhou"
}
}
}
}4. 重启 Claude Desktop
配置完成后重启,即可在对话中使用图片分析功能。
在 Claude 中使用
配置好后,直接对话即可:
请帮我看看这张图片是什么:https://example.com/screenshot.png[粘贴图片] 这张图的布局怎么实现的?支持的图片格式
- HTTP URL:
https://example.com/image.jpg - 本地路径:
/Users/xxx/Pictures/screenshot.png - base64:
data:image/png;base64,iVBORw0KG...
环境变量
| 变量 | 说明 | 默认值 | |-----|------|--------| | DASHSCOPE_API_KEY | API密钥(必需) | - | | QWEN_VISION_MODEL | 模型选择 | qwen-vl-plus | | BAILIAN_REGION | 服务区域 | cn-beijing |
可用区域:cn-beijing | cn-singapore | us-virginia
开发调试
# 安装依赖
npm install
# 开发模式(自动编译)
npm run dev
# 构建
npm run build
# 测试
node test/test-api.js相关链接
致谢
本项目基于 @mcpcn/image-understanding-mcp 改造
许可证
MIT
