@remixmate/cli
v0.9.6
Published
AI media generation skills for Claude Code / Codex — 11 skills covering image, video, voice, digital human, web capture, script, template registry, rendering, Jianying export, and video deconstruction.
Downloads
1,026
Maintainers
Readme
@remixmate/cli
English | 简体中文
原名
ab-skill-cli(binab-skill),现已更名为@remixmate/cli(binremixmate)。旧包已在 npm 标记弃用,请迁移到新包。
面向 Claude Code / Codex 的 AI 媒体生成技能集。
包含 11 个技能,覆盖完整的短视频生产链路:图片 / 视频 / 语音 / 数字人素材生成、网页捕获、脚本编排、模板绑定、Remotion 渲染、剪映(CapCut)草稿导出,以及视频解构。
安装
npm install -g @remixmate/cli
remixmate --help
remixmate --list在 Claude Code 中使用
把内置的 skills/ 拷贝到项目级或全局的 .claude/skills/ 目录,Claude Code 会自动识别:
# 项目级
mkdir -p .claude/skills
cp -R "$(npm root -g)/@remixmate/cli/skills/." .claude/skills/
# 或全局
mkdir -p ~/.claude/skills
cp -R "$(npm root -g)/@remixmate/cli/skills/." ~/.claude/skills/在 Codex 中使用
Codex 不会原生加载 SKILL.md。在系统提示里告诉 Codex 这个 CLI,让它在需要媒体生成时调用 remixmate <skill> ...:
当你需要 AI 媒体生成(图片 / 视频 / 语音 / 数字人 / 剪映导出)时,先运行
remixmate <skill-id> --help查看参数,再用remixmate <skill-id> --json-output ...执行。可用技能:remixmate --list。
完整介绍页(Claude Code / Codex 配置、环境变量、端到端工作流示例)见项目主页。
认证
推荐方式(人类用户):浏览器设备登录,无需手动粘贴 token:
remixmate login # 在浏览器确认授权,凭证安全保存到本机
remixmate whoami # 查看当前身份(绝不打印 token)
remixmate logout # 从本机移除已存储的凭证login 使用 OAuth 2.0 设备授权流程(RFC 8628):CLI 显示设备码,你在已登录 Web 的浏览器中确认,CLI 随后取回凭证并保存到系统钥匙串(或 ~/.config/remixmate/credentials.json,权限 0600)。仅在交互式终端中可用。
CI 与 agent 宿主(ab-agent / Claude Code)继续使用 PRIV_TOKEN 环境变量。凭证解析优先级:
--token 参数 > PRIV_TOKEN 环境变量 > 本地已存凭证(remixmate login 写入)设置了 PRIV_TOKEN 时,login 会跳过,且任何命令都不会自动触发设备登录流程。
安全提示:若你此前曾把
PRIV_TOKEN粘贴到聊天框或写进 shell 历史,切换到remixmate login后建议轮换该 token。
环境
多数技能通过 PRIV_TOKEN 向 ab-api 鉴权。没有有效 token(以及访问 ab-api 的网络)时,模板 / 媒体生成类技能不可用——代码是开源的,但生成能力托管在 ab-api 服务上。运行前把 .env.example 拷为 .env 并 source:
cp .env.example .env
# 修改其中的值
source .envPython 技能(11 个中的 6 个)需要 python3 >= 3.10。web-capture 需要 Playwright(首次运行自动安装 chromium)。ffmpeg 仅 video-parser 的可选本地工具(deconstruct_video.py)需要;video-parser 默认入口走 ab-render 服务端解构,无需本地 ffmpeg。
技能
本项目包含 11 个 AI 媒体生成技能,覆盖从素材生成、脚本编排、模板绑定、视频渲染到剪映导出的完整视频内容生产链路。
技能分层
┌─────────────────────────────────────────────────────────────┐
│ 编排层 Skills │
│ gen-script 主题 → Video DSL(脚本生成) │
│ template-registry DSL → TemplateBinding(模板列表) │
│ prepare-video-assets DSL + Binding → 素材补齐(Phase 1) │
│ render-video RenderPlan → Remotion 渲染(Phase 3) │
│ export-jianying 素材 → 剪映草稿 ZIP │
├─────────────────────────────────────────────────────────────┤
│ 原子层 Skills │
│ gen-image 文生图 / 图生图(Seedream / Gemini) │
│ gen-video 文生视频(Seedance / Veo) │
│ gen-voice 语音合成(Minimax TTS) │
│ gen-digital-human 数字人口播(即梦 / 飞影) │
├─────────────────────────────────────────────────────────────┤
│ 工具层 Skills │
│ video-parser 视频解构(音频提取 / ASR / 关键帧) │
│ web-capture 网页截图 / 滚动录屏 / 分镜视频 │
└─────────────────────────────────────────────────────────────┘目录结构
├── docs/
│ └── video-production-architecture.md # 架构文档
├── src/ # TypeScript CLI + http/builtin handlers
├── skills/
│ ├── gen-image/ # 原子: AI 生图(http handler)
│ ├── gen-video/ # 原子: AI 生视频(http handler)
│ ├── gen-voice/ # 原子: 语音合成(http handler)
│ ├── gen-digital-human/ # 原子: 数字人口播(http handler)
│ ├── gen-script/ # 编排: 主题 → Video DSL
│ ├── template-registry/ # 编排: 模板列表(python list_templates.py)
│ ├── prepare-video-assets/ # 编排: Phase 1 素材准备(thin wrapper)
│ ├── render-video/ # 编排: Phase 3 Remotion 渲染(含 render_video.py 实现)
│ ├── export-jianying/ # 编排: 导出剪映草稿 ZIP
│ ├── video-parser/ # 工具: 视频解构与分析
│ └── web-capture/ # 工具: 无头浏览器截图 / 录屏
└── README.md技能说明
| 技能 | 类型 | 说明 | 运行方式 / entry |
|------|------|------|------------------|
| gen-image | 原子 | 文生图 / 图生图(Seedream、Gemini) | http handler |
| gen-video | 原子 | 文生视频(Seedance、Veo) | http handler |
| gen-voice | 原子 | 语音合成(Minimax TTS) | http handler |
| gen-digital-human | 原子 | 数字人口播(即梦 / 飞影) | http handler |
| gen-script | 编排 | 主题 → Video DSL JSON | python scripts/gen_script.py |
| template-registry | 编排 | 模板列表(绑定逻辑内嵌于 prepare-video-assets) | python scripts/list_templates.py |
| prepare-video-assets | 编排 | DSL + Binding → 素材补齐 → 落库 RenderPlan | python scripts/prepare_video_assets.py(包装 render_video.py --resolve-only) |
| render-video | 编排 | job_id → Remotion 渲染 → 上传 | python scripts/render_video.py |
| export-jianying | 编排 | 素材 URL → 剪映草稿 ZIP(支持从 RenderPlan 自动转换) | python scripts/gen_jianying_draft.py |
| video-parser | 工具 | 视频 → 音频 + ASR + 关键帧 + 场景分段 | python scripts/parse_via_render.py |
| web-capture | 工具 | 网页截图 / 滚动录屏 / 分镜视频 | python scripts/screenshot.py、scripts/record.py |
核心链路
详见 视频内容生产架构文档 和 编排流程指南。
链路 A:主题 → Remotion 视频
gen-script → ✅用户确认脚本 → prepare-video-assets(--template-id)
→ ✅用户确认素材 → render-video(--job-id) → MP4链路 B:主题 → 剪映草稿
gen-script → ✅用户确认脚本 → prepare-video-assets(--template-id)
→ ✅用户确认素材 → export-jianying(--from-job-id) → 剪映 ZIP测试
# 列出所有技能(名称、tool、entry 类型)
remixmate --list
# 离线注册表 smoke + 规范守卫
npm run smoke
# CLI 单元测试(argv 解析器 + skill schema)
npm run test:cli
# Python 技能会把 --help 透传给底层脚本:
remixmate gen-script --help
remixmate prepare-video-assets --help
remixmate render-video --help
remixmate export-jianying --help
remixmate video-parser --help
remixmate web-capture --help
remixmate template-registry --help
# http 技能(gen-image、gen-video、gen-voice、gen-digital-human)没有
# python --help;参数见各自的 SKILL.md / skill.json。
# 查看可用音色
remixmate gen-voice --list-voices
# 查看可用模板
remixmate template-registry --list-templates开发流程
- 克隆此项目到本地
- 在 skills 目录下各技能文件夹中开发
- 每个技能包含
SKILL.md(技能说明)、version.json(元数据)和scripts/(脚本)
快速体验
@skills/gen-image/SKILL.md 生成一张熊猫的图片,9:16,调用gemini 3.1,国画风 + 严格按该文档执行
@skills/gen-video/SKILL.md 生成一段熊猫在竹林奔跑的视频,9:16,长度6秒,调用veo + 严格按该文档执行
@skills/gen-voice/SKILL.md 生成一段语音,介绍熊猫的习性,大概100字左右 + 严格按该文档执行
@skills/gen-digital-human/SKILL.md 获取数字人列表 + 严格按该文档执行
@skills/template-registry/SKILL.md 获取模版列表 + 严格按该文档执行
@skills/gen-script/SKILL.md 基于模版 image-slide,创作一个关于AI学习方法的视频 + 严格按该文档执行许可证
MIT
