@tonychaos/mcp-server-doubao

v1.2.0

Published

11 days ago

MCP server for Doubao (豆包) AI models - Comprehensive Image and Video generation with 4 image models and 2 video models

0High
0Medium
0Low

mcp model-context-protocol doubao 豆包 image-generation video-generation ai seedream seedance 4k text-to-image text-to-video multi-image-fusion stable-diffusion-alternative

豆包 (Doubao) MCP Server

基于 Model Context Protocol (MCP) 的豆包AI模型服务器，支持图片生成和视频生成功能。

✨ 功能特性

🎨 图片生成 (Doubao Seedream)

支持的模型

| 模型 | 任务类型 | 特点 | |------|---------|------| | doubao-seedream-4.5 | 文生图、单图生图、多图融合(2-14)、组图 | 最新最强，4K超高清，流式输出 | | doubao-seedream-4.0 | 文生图、单图生图、多图融合(2-14)、组图 | 4K超高清，强主体一致性 | | doubao-seedream-3.0-t2i | 文生图 | 支持 seed 和 guidance_scale | | doubao-seededit-3.0-i2i | 单图生图 | 支持 adaptive 尺寸 |

核心能力

✅ 文生图 - 纯文本提示生成图片
✅ 单图生图 - 一张参考图 + 文本提示 → 生成新图片
✅ 多图融合 - 多张参考图(2-14张) + 文本提示 → 融合生成
✅ 组图功能 - 生成一组内容关联的图片(最多15张)
✅ 4K超高清 - 最高 4096x4096 分辨率
✅ 自定义尺寸 - 支持自定义像素值，如 2560x1440 (16:9)
✅ Base64返回 - 支持返回 Base64 编码的图片数据
✅ 提示词优化 - 自动优化提示词以提升生成质量
✅ 水印控制 - 可选择是否添加水印
✅ 流式输出 - 实时返回生成进度(4.5/4.0)

图片要求

格式: jpeg, png, webp, bmp, tiff, gif
大小: 最大 10MB
分辨率: 总像素 ≤ 36,000,000 (6000x6000)
宽高比: [1/16, 16] (4.5/4.0), [1/3, 3] (3.0)

🎬 视频生成 (Doubao Seedance)

支持的任务类型

✅ 文生视频 - 从文本提示生成视频
✅ 首帧图生视频 - 从首帧图片和文本生成视频
✅ 首尾帧图生视频 - 从首尾帧图片和文本生成视频
✅ 图生视频(带遮罩) - 从图片、遮罩和文本生成视频

核心能力

✅ 音画同步 - 自动生成与画面匹配的音频
✅ 异步处理 - 支持任务创建和状态查询
✅ 任务列表 - 批量查询任务状态
✅ 任务取消 - 取消正在进行的任务
✅ 多种分辨率 - 720p, 1080p, 1440p

📦 安装

npm 全局安装

npm install -g @tonychaos/mcp-server-doubao

npx 直接运行（无需安装）

npx @tonychaos/mcp-server-doubao

⚙️ 配置

1. 获取 API Key

访问火山方舟控制台
登录账号
进入「API Key 管理」创建 API Key

2. 配置 Claude Desktop

在 Claude Desktop 的配置文件中添加：

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json

Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "doubao": {
      "command": "npx",
      "args": ["-y", "@tonychaos/mcp-server-doubao"],
      "env": {
        "ARK_API_KEY": "your_api_key_here"
      }
    }
  }
}

3. 重启 Claude Desktop

配置完成后，重启 Claude Desktop 以加载 MCP 服务器。

🚀 使用方法

图片生成示例

文生图 (2K 高清)

请使用豆包生成一张 2K 图片：一只在花园里玩耍的橘猫，阳光明媚

文生图 (4K 超高清)

请使用豆包生成一张 4K 图片：未来城市夜景，赛博朋克风格，霓虹灯光

文生图 (自定义宽高比)

请使用豆包生成一张 21:9 的图片：壮丽的山川风景，全景视野

组图生成

请使用豆包生成一组图片（4张）：春夏秋冬四季的森林景色

单图生图

请基于这张图片生成一张新图：https://example.com/cat.jpg
让图片中的猫咪戴上一顶红色的帽子，保持其他元素不变

多图融合

请基于这两张图片生成一张新图：
图片1: https://example.com/style.jpg
图片2: https://example.com/content.jpg
将图片1的艺术风格应用到图片2的内容上

无水印高清图

请生成一张无水印的图片：一只金毛犬在海滩上奔跑

视频生成示例

文生视频

请使用豆包生成一个视频：无人机以极快速度穿越复杂障碍，带来沉浸式飞行体验

首帧图生视频

请基于这张图片生成一个视频：https://example.com/frame.jpg
让画面中的风景逐渐变得明亮，阳光从云层中射出

首尾帧图生视频

请基于这两张图片生成一个视频：
首帧: https://example.com/start.jpg
尾帧: https://example.com/end.jpg
描述: 平滑的日转夜过渡效果

查询视频任务状态

请查询视频任务 task_id_xxx 的状态

查询所有视频任务

请查询最近创建的所有视频任务

🔧 开发

环境要求

Node.js >= 18.0.0
npm 或 yarn

构建项目

# 安装依赖
npm install

# 构建项目
npm run build

# 本地运行
ARK_API_KEY=your_api_key_here npm start

开发模式

# 监听文件变化自动构建
npm run watch

# 构建并运行
npm run dev

运行测试

# 图片生成测试
npx tsx test-image.ts

# 完整功能测试
npx tsx test-image-complete.ts

# 视频生成测试
npx tsx test-video.ts

📚 API 参考

图片生成 API

端点: https://ark.cn-beijing.volces.com/api/v3/images/generations

支持模型:

doubao-seedream-4-5-251128 (推荐)
doubao-seedream-4-0-250428
doubao-seedream-3-0-t2i
doubao-seededit-3-0-i2i

价格参考:

2K 图片: ~0.25元/张
4K 图片: ~0.5元/张

官方文档: 图片生成 API

视频生成 API

创建任务: POST https://ark.cn-beijing.volces.com/api/v3/contents/generations/tasks

查询任务: GET https://ark.cn-beijing.volces.com/api/v3/contents/generations/tasks/{id}

支持模型:

doubao-seedance-1-5-pro-251215 (推荐)
doubao-seedance-1-5 (经济版)

价格参考:

1.5-pro (有声): ~16元/百万tokens
1.5 (有声): ~4元/百万tokens

官方文档: 视频生成 API

📁 项目结构

mcp-server-doubao/
├── src/
│   ├── index.ts              # 主入口文件
│   ├── server.ts             # MCP 服务器配置
│   ├── tools/                # MCP 工具实现
│   │   ├── image-generation.ts   # 图片生成工具
│   │   └── video-generation.ts   # 视频生成工具
│   ├── api/                  # API 客户端
│   │   ├── client.ts             # 基础 API 客户端
│   │   ├── image-api.ts          # 图片生成 API
│   │   └── video-api.ts          # 视频生成 API
│   ├── types/                # TypeScript 类型定义
│   │   ├── index.ts
│   │   ├── image.ts              # 图片相关类型
│   │   └── video.ts              # 视频相关类型
│   └── utils/                # 工具函数
├── dist/                     # 编译输出目录
├── test-*.ts                 # 测试文件
├── package.json
├── tsconfig.json
└── README.md

🎯 工具和参数说明

图片生成工具

generate_image (文生图/组图)

主要参数:

prompt (必选): 文本提示词
model: 模型选择，默认 "doubao-seedream-4-5-251128"
size: 图片尺寸 ("2K", "4K", "WIDTHxHEIGHT", "adaptive")
sequential_image_generation: 组图模式 ("auto", "disabled")
max_images: 最大生成图片数 [1-15]
response_format: 返回格式 ("url", "b64_json")
watermark: 是否添加水印 (默认 true)

image_to_image (图生图/多图融合)

主要参数:

prompt (必选): 文本提示词
imageUrl: 单张参考图 URL
imageUrls: 多张参考图 URL 数组 [2-14]
model: 模型选择
size: 图片尺寸
sequential_image_generation: 组图模式

视频生成工具

generate_video (创建视频任务)

主要参数:

prompt (必选): 文本提示词
task_type: 任务类型 ("text_to_video", "image_to_video", "frames_to_video")
image_url: 首帧图片 URL
end_image_url: 尾帧图片 URL
mask_url: 遮罩图片 URL
resolution: 分辨率 ("720p", "1080p", "1440p")
duration: 视频时长 [3-10秒]

query_video_task (查询视频任务)

主要参数:

task_id (必选): 任务 ID

📝 更新日志

v1.1.0 (2025-01-11)

✨ 新增完整的图片生成功能支持
- 支持 4 个模型 (4.5, 4.0, 3.0-t2i, 3.0-i2i)
- 文生图、单图生图、多图融合(2-14张)
- 组图功能，最多生成 15 张关联图片
- 4K 超高清输出
- 自定义像素值尺寸
- Base64 返回格式
- 提示词优化
- 水印控制
- 流式输出支持
✨ 新增完整的视频生成功能支持
- 支持 2 个模型 (1.5-pro, 1.5)
- 4 种任务类型
- 任务状态查询
- 任务列表查询
- 任务取消功能
📝 完善的工具参数说明和使用示例
🧪 添加完整的测试用例

v1.0.0 (2025-01-10)

🎉 初始版本发布
✅ 基础图片生成功能
✅ 基础视频生成功能

📄 许可证

MIT

🔗 相关链接

💬 支持

如有问题或建议，请提交 Issue。

🙏 致谢

感谢 Anthropic 开发的 Model Context Protocol 框架。

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme

豆包 (Doubao) MCP Server

✨ 功能特性

🎨 图片生成 (Doubao Seedream)

支持的模型

核心能力

图片要求

🎬 视频生成 (Doubao Seedance)

支持的任务类型

核心能力

📦 安装

npm 全局安装

npx 直接运行（无需安装）

⚙️ 配置

1. 获取 API Key

2. 配置 Claude Desktop

3. 重启 Claude Desktop

🚀 使用方法

图片生成示例

文生图 (2K 高清)

文生图 (4K 超高清)

文生图 (自定义宽高比)

组图生成

单图生图

多图融合

无水印高清图

视频生成示例

文生视频

首帧图生视频

首尾帧图生视频

查询视频任务状态

查询所有视频任务

🔧 开发

环境要求

构建项目

开发模式

运行测试

📚 API 参考

图片生成 API

视频生成 API

📁 项目结构

🎯 工具和参数说明

图片生成工具

generate_image (文生图/组图)

image_to_image (图生图/多图融合)

视频生成工具

generate_video (创建视频任务)

query_video_task (查询视频任务)

📝 更新日志

v1.1.0 (2025-01-11)

v1.0.0 (2025-01-10)

📄 许可证

🔗 相关链接

💬 支持

🙏 致谢