mcp-ktt-ocr
v1.0.2
Published
MCP service for order screenshot OCR recognition using Alibaba Cloud Bailian qwen-vl model
Maintainers
Readme
MCP Order OCR Service
基于阿里云百炼 qwen-vl 模型的订单截图 OCR 识别 MCP 服务。
功能特性
- 电商截图识别 (
recognize_ecommerce_screenshot):识别电商平台小程序截图,支持三种类型:- 订单信息截图:提取团长名称、商品名称、发货状态、跟团号、下单人昵称、订单编号等
- 商品信息截图:提取商品名称
- 收款二维码截图:识别二维码类型
- 支持自定义提示词覆盖默认识别逻辑
- 通用 OCR (
general_ocr):通用图片文字识别,提取图片中的所有文字内容 - 图片内容分析 (
analyze_image_content):分析图片内容,判断图片类型并提取关键信息
安装
npm install mcp-order-ocr配置
环境变量
在使用前需要设置阿里云 DashScope API Key:
export DASHSCOPE_API_KEY=your_api_key_here在百炼平台配置 MCP 服务
- 登录百炼控制台:https://bailian.console.aliyun.com/
- 进入「插件」->「MCP 服务」
- 点击「新增自定义 MCP」
- 填写 npm 包名:
mcp-order-ocr - 配置环境变量:
DASHSCOPE_API_KEY - 保存并在智能体应用中启用
工具说明
1. recognize_ecommerce_screenshot
识别电商平台小程序截图,自动分类并提取结构化信息。
参数:
image_url(string, 必填):截图的 URL 地址custom_prompt(string, 可选):自定义识别提示词,覆盖默认提示词
返回示例:
订单信息截图:
{
"type": "order",
"leader_name": "团团优选",
"product_name": "【厚底小金豆双带勃肯凉拖鞋】",
"delivery_status": "已发货",
"pay_amount": "29.9",
"group_number": "371",
"nickname": "用户昵称",
"order_number": "250704-308244682452790"
}商品信息截图:
{
"type": "product",
"product_name": "【厚底小金豆双带勃肯凉拖鞋】"
}收款二维码截图:
{
"type": "qrcode"
}其他类型:
{
"type": "unknown"
}2. general_ocr
通用图片文字识别。
参数:
image_url(string, 必填):图片的 URL 地址custom_prompt(string, 可选):自定义提示词
3. analyze_image_content
分析图片内容和类型。
参数:
image_url(string, 必填):图片的 URL 地址
返回示例:
{
"image_type": "订单截图",
"key_info": {
"order_id": "250704-308244682452790",
"product": "凉拖鞋"
},
"suggested_action": "可以查询该订单的物流信息"
}本地开发
# 克隆项目
git clone <repo_url>
cd mcp-ocr-service
# 安装依赖
npm install
# 编译
npm run build
# 运行(需要设置 DASHSCOPE_API_KEY)
npm start技术栈
- TypeScript
- @modelcontextprotocol/sdk
- 阿里云 DashScope qwen-vl-max 模型
License
MIT
