@dataify/dataify-mcp
v1.0.0
Published
Dataify MCP server for web unlocker, SERP, and scraper builder tools.
Maintainers
Readme
Dataify MCP
Dataify MCP 用于把 Dataify 的网页解锁、SERP 搜索和 Scraper Builder 采集能力暴露给支持 MCP 的客户端。项目支持 Dataify 官方托管 MCP 地址、本地 npx stdio 启动方式,以及通过环境变量选择工具。
快速开始
如果你的 MCP 客户端支持远程 Streamable HTTP,推荐直接使用 Dataify 托管 MCP:
https://mcp.dataify.com/mcp?token=YOUR_DATAIFY_TOKEN&tools=user_info,web_unlocker,google_serp,yandex_serp,duckduckgo_serp,bing_serp,amazon,youtube,facebook,instagram,reddit,walmart,google,booking,indeed,airbnb,google_play_store,github,tiktok,linkedin,glassdoor,twitter,crunchbase,zillow,ebay如果客户端需要 SSE,使用对应的 SSE 地址:
https://mcp.dataify.com/sse?token=YOUR_DATAIFY_TOKEN&tools=user_info,web_unlocker,google_serp,yandex_serp,duckduckgo_serp,bing_serp,amazon,youtube,facebook,instagram,reddit,walmart,google,booking,indeed,airbnb,google_play_store,github,tiktok,linkedin,glassdoor,twitter,crunchbase,zillow,ebay如果你的 MCP 客户端通过本地命令启动服务,可以使用 npm 包:
{
"mcpServers": {
"dataify": {
"command": "npx",
"args": ["@dataify/dataify-mcp"],
"env": {
"DATAIFY_API_TOKEN": "YOUR_DATAIFY_TOKEN",
"GROUPS": "web_unlocker,google_serp,bing_serp,youtube"
}
}
}
}本地运行
npm install
npm run startnpm run start 会启动 stdio MCP 服务,并等待 MCP 客户端连接。它不会像普通 CLI 命令一样立即退出,这是正常现象。
工具选择
本地 npm 包支持通过环境变量选择工具:
GROUPS:按工具分组启用,多个分组用英文逗号分隔。TOOLS:按具体工具名启用,多个工具用英文逗号分隔。DATAIFY_TOOLS:兼容旧配置,等同于TOOLS。
如果不配置 GROUPS 或 TOOLS,本地服务会注册全部工具。
支持的分组:
user_info, web_unlocker, google_serp, yandex_serp, duckduckgo_serp, bing_serp,
amazon, youtube, facebook, instagram, reddit, walmart, google, booking,
indeed, airbnb, google_play_store, github, tiktok, linkedin, glassdoor,
twitter, crunchbase, zillow, ebay示例:
GROUPS=web_unlocker,google_serp npm run start
GROUPS=youtube TOOLS=google_search npm run start环境变量
DATAIFY_API_TOKEN:Dataify API Token,本地 stdio 包调用 Dataify API 时使用。DATAIFY_WEB_UNLOCKER_URL:Web Unlocker 地址,默认https://webunlocker.dataify.com。DATAIFY_SERP_API_URL:SERP API 地址,默认https://scraperapi.dataify.com。DATAIFY_SCRAPER_API_URL:Scraper Builder API 地址,默认https://scraperapi.dataify.com。DATAIFY_TIMEOUT_MS:请求超时时间,默认120000毫秒。GROUPS:可选,按分组启用工具。TOOLS:可选,按具体工具名启用工具。DATAIFY_TOOLS:可选,兼容旧配置,等同于TOOLS。
托管服务与本地包的区别
https://mcp.dataify.com/mcp 和 https://mcp.dataify.com/sse 是完整的 Dataify 托管 MCP 服务,由 Go 版 dataify_mcp_api 服务提供能力。它可以暴露用户信息、余额、任务状态、统计、工具权限等依赖内部数据库的工具。
当前 npm 包是本地 stdio MCP 包,主要用于本地 MCP 客户端通过 npx 启动。它直接调用公开的 Dataify API。对于依赖 MySQL、ClickHouse 或 Redis 的内部工具,本地包会保留工具名,但调用时会返回明确的“不支持”提示。
兼容说明
@modelcontextprotocol/sdk 当前固定为 1.10.2,因为 [email protected] 与较新的 MCP SDK completion capability 校验不兼容。
