volcengine-imagegen-mcp
v1.0.1
Published
MCP server for Volcengine AI image generation (豆包生图)
Maintainers
Readme
🎨 VolcEngine Image Generation MCP Server
纯 Node.js + TypeScript 实现的 MCP 服务器,为 Claude Desktop、VS Code、Cursor、Trae 等 AI 应用提供火山引擎豆包生图能力。
✨ 特性
- 🎨 文生图: 根据文本提示词生成图片
- 🖼️ 图生图: 根据参考图片和文本生成新图片
- 📸 组图生成: 生成一组内容关联的图片(最多15张)
- 🎯 多模型支持: 支持 doubao-seedream 4.5/4.0/3.0 系列
- 📐 多尺寸支持: 2K, 4K, 1024x1024, 2048x2048
- 🔄 灵活输出: 支持返回 URL 或 Base64 格式
- 💧 水印控制: 可选择是否添加水印
📦 安装
1. 全局安装(推荐)
npm install -g volcengine-imagegen-mcp2. 使用 npx 运行(无需安装)
npx volcengine-imagegen-mcp🔑 配置 API Key
在使用之前,需要设置火山引擎 API Key:
Windows
set ARK_API_KEY=你的火山引擎API密钥PowerShell
$env:ARK_API_KEY="你的火山引擎API密钥"Linux/macOS
export ARK_API_KEY="你的火山引擎API密钥"如何获取 API Key?
- 访问 火山方舟控制台
- 登录火山引擎账号
- 创建 API Key
- 复制 API Key 并设置环境变量
💡 配置方式说明: 不同应用的配置格式略有不同:
- Claude Code/Claude Desktop: 使用
"mcpServers"键,配置简单(见下方)- VS Code: 使用
"servers"键,需要指定"type": "stdio"(见下方)- Cursor/Trae: 配置格式类似 Claude Code/Claude Desktop
🚀 使用方法
在 Claude Code / Claude Desktop 中使用
- 打开 Claude Code 或 Claude Desktop 设置
- 找到 MCP Servers 配置项
- 添加新服务器:
- 名称:
volcengine-imagegen-mcp - 命令:
npx volcengine-imagegen-mcp - 环境变量:
ARK_API_KEY=你的API密钥
- 名称:
- 保存配置并重启应用
在 VS Code 中使用
- 确保已安装 VS Code 1.102 或更高版本
- 在工作区根目录创建
.vscode/mcp.json文件 - 添加以下配置:
{ "servers": { "volcengine-imagegen": { "type": "stdio", "command": "npx", "args": ["volcengine-imagegen-mcp"], "env": { "ARK_API_KEY": "你的API密钥" } } }, "inputs": [] } - 重新加载 VS Code 窗口(
Ctrl+Shift+P→ "Developer: Reload Window") - 打开 Copilot Chat(
Ctrl+Alt+I),在工具选择器中启用volcengine-imagegen服务器的工具
💡 工具选择说明: VS Code 中有两种方式管理 MCP 工具:
- 工具选择器按钮:在 Chat 输入框上方点击工具图标(🛠️),可以单独启用/禁用每个工具
- Chat 输入中指定:在提示中直接引用工具,如
#generate_image- 全局配置:在设置中通过
chat.mcp.enabledServers控制哪些服务器可用使用示例:
- 禁用所有工具后只使用
#generate_image和#list_models- 或通过工具选择器只勾选
generate_image相关工具💡 详细配置说明请查看 VS Code 配置指南
在 Cursor 中使用
- 打开 Cursor 设置
- 找到 MCP 配置
- 添加服务器:
{ "name": "volcengine-imagegen", "command": "npx", "args": ["volcengine-imagegen-mcp"], "env": { "ARK_API_KEY": "你的API密钥" } }
在 Trae 中使用
Trae 原生支持火山引擎 MCP 服务,可以直接在火山引擎 MCP 市场中选择使用。
🛠️ 可用工具
1. generate_image - 文生图
根据文本提示词生成图片。
参数:
model(string): 模型 ID,默认 "doubao-seedream-4.5"prompt(string): 图片生成提示词(支持中英文)size(string): 图片尺寸,默认 "2K"(支持:2K, 4K, 1024x1024, 2048x2048)guidance_scale(number): 文本权重(1-10),默认 2.5response_format(string): 返回格式,默认 "url"(支持:url, b64_json)watermark(boolean): 是否添加水印,默认 falsecount(number): 生成图片数量(1-4张),默认 1
示例提示:
生成一张充满活力的特写肖像,模特眼神犀利2. image_to_image - 图生图
根据参考图片和文本提示词生成新图片。
参数:
model(string): 模型 ID,默认 "doubao-seedream-4.5"prompt(string): 图片生成提示词image_urls(array): 参考图片 URL 列表(最多14张)size(string): 图片尺寸,默认 "2K"guidance_scale(number): 文本权重(1-10),默认 2.5response_format(string): 返回格式,默认 "url"watermark(boolean): 是否添加水印,默认 false
示例提示:
根据这张图片的风格,生成一张新的城市夜景照片
[上传参考图片]3. generate_image_set - 组图生成
生成一组内容关联的图片(最多15张)。
参数:
model(string): 模型 ID,默认 "doubao-seedream-4.5"prompt(string): 图片生成提示词count(number): 生成图片数量(2-15张),默认 4size(string): 图片尺寸,默认 "2K"guidance_scale(number): 文本权重(1-10),默认 2.5response_format(string): 返回格式,默认 "url"watermark(boolean): 是否添加水印,默认 false
示例提示:
生成一组4张科幻风格的太空探索主题插画4. list_models - 获取模型列表
获取所有支持的模型及其说明。
📋 支持的模型
| 模型 ID | 说明 | 支持的功能 |
|---------|------|-------------|
| doubao-seedream-4.5 | 豆包生图 4.5(最新) | ✅ 文生图 ✅ 图生图 ✅ 组图 ✅ 多图生图 |
| doubao-seedream-4.0 | 豆包生图 4.0 | ✅ 文生图 ✅ 图生图 ✅ 组图 ✅ 多图生图 |
| doubao-seedream-3.0-t2i | 豆包生图 3.0 文生图 | ✅ 仅文生图 |
| doubao-seedream-3.0-i2i | 豆包生图 3.0 图生图 | ✅ 仅图生图 |
📸 快速开始
1️⃣ 安装
npm install -g volcengine-imagegen-mcp2️⃣ 配置 API Key
访问 火山方舟控制台 获取 API Key,然后设置环境变量:
# Windows PowerShell
$env:ARK_API_KEY="your-api-key-here"
# Linux/macOS
export ARK_API_KEY="your-api-key-here"3️⃣ 配置 Claude Desktop
编辑 Claude Desktop 配置文件(claude_desktop_config.json):
{
"mcpServers": {
"volcengine-imagegen": {
"command": "npx",
"args": ["volcengine-imagegen-mcp"],
"env": {
"ARK_API_KEY": "your-api-key-here"
}
}
}
}4️⃣ 开始创作
重启 Claude Desktop,然后直接对话:
- "帮我生成一只赛博朋克风格的猫"
- "根据这张照片生成卡通版本"
- "生成一组 4 张太空主题插画"
⚙️ 高级配置
环境变量
| 变量名 | 说明 | 必需 |
|---------|------|-------|
| ARK_API_KEY | 火山引擎 API 密钥 | ✅ 是 |
返回格式选择
- url: 返回图片下载链接(24小时内有效)
- b64_json: 直接返回 Base64 编码的图片数据
建议:
- 需要快速预览或嵌入应用 → 使用
b64_json - 需要高质量下载或长期保存 → 使用
url
🎯 使用建议
提示词编写技巧
- 详细描述: 包含主体、风格、颜色、构图等要素
- 中英文混合: 模型对中英文都有良好理解能力
- 风格指定: 明确指定想要的风格(如"写实风格"、"动漫风格"等)
- 质量关键词: 添加"高清"、"4K"、"专业"等关键词提升质量
参数调优建议
| 参数 | 低值 | 高值 | 效果 |
|------|-------|-------|------|
| guidance_scale | 1-3 | 7-10 | 低值更自由创作,高值更严格遵循提示词 |
| size | 2K, 1024x1024 | 4K, 2048x2048 | 大尺寸需要更多时间和算力 |
成本控制
- 图片链接 24小时后失效,请及时下载
- 组图生成(15张)需要较长时间,建议先用少量测试
- 4K 分辨率生成成本高于 2K
💡 使用示例
📝 文生图示例
用户: 帮我生成一张照片,内容是日落时分的埃菲尔铁塔,背景是巴黎城市景观
Claude: [调用 generate_image 工具]
✓ 生成完成!图片包含金色的阳光洒在埃菲尔铁塔上...🖼️ 图生图示例
用户: [上传一张风景照]
用户: 把这张照片改成宫崎骏动画风格
Claude: [调用 image_to_image 工具]
✓ 转换完成!已将照片转换为温馨的吉卜力动画风格...🎨 组图生成示例
用户: 帮我设计一套猫咪主题的表情包,要 6 张不同表情
Claude: [调用 generate_image_set 工具,count=6]
✓ 已生成 6 张猫咪表情包:开心、生气、惊讶、卖萌、睡觉、思考...🎯 应用场景
- 内容创作: 快速生成配图、插画、海报素材
- 设计灵感: 探索不同的视觉风格和创意方向
- 图片编辑: 风格迁移、图片重绘、创意合成
- 原型设计: 为产品快速生成视觉概念图
- 教育培训: 生成教学插图和示例图片
🔧 开发
构建
npm install
npm run build本地运行
npm run start开发模式
npm run dev📄 许可证
MIT © fucheng830
🤝 贡献
欢迎提交 Issue 和 Pull Request!
- Fork 本仓库
- 创建特性分支 (
git checkout -b feature/AmazingFeature) - 提交更改 (
git commit -m 'Add some AmazingFeature') - 推送到分支 (
git push origin feature/AmazingFeature) - 开启 Pull Request
📞 支持
- 🐛 问题反馈
- 📖 火山引擎文档
- 📖 VS Code 配置指南
- 💬 讨论区
🔗 相关链接
🔗 相关链接
⭐ Star History
如果这个项目对你有帮助,请给个 Star 支持一下!
