@remixmate/cli

v0.9.6

Published

7 days ago

AI media generation skills for Claude Code / Codex — 11 skills covering image, video, voice, digital human, web capture, script, template registry, rendering, Jianying export, and video deconstruction.

Downloads

1,026

0High
0Medium
0Low

remixmate.ai

claude-code codex agent-skills ai-video tts text-to-speech image-generation remotion jianying

@remixmate/cli

English | 简体中文

原名 ab-skill-cli（bin ab-skill），现已更名为 @remixmate/cli（bin remixmate）。旧包已在 npm 标记弃用，请迁移到新包。

面向 Claude Code / Codex 的 AI 媒体生成技能集。

包含 11 个技能，覆盖完整的短视频生产链路：图片 / 视频 / 语音 / 数字人素材生成、网页捕获、脚本编排、模板绑定、Remotion 渲染、剪映（CapCut）草稿导出，以及视频解构。

安装

npm install -g @remixmate/cli
remixmate --help
remixmate --list

在 Claude Code 中使用

把内置的 skills/ 拷贝到项目级或全局的 .claude/skills/ 目录，Claude Code 会自动识别：

# 项目级
mkdir -p .claude/skills
cp -R "$(npm root -g)/@remixmate/cli/skills/." .claude/skills/

# 或全局
mkdir -p ~/.claude/skills
cp -R "$(npm root -g)/@remixmate/cli/skills/." ~/.claude/skills/

在 Codex 中使用

Codex 不会原生加载 SKILL.md。在系统提示里告诉 Codex 这个 CLI，让它在需要媒体生成时调用 remixmate <skill> ...：

当你需要 AI 媒体生成（图片 / 视频 / 语音 / 数字人 / 剪映导出）时，先运行 remixmate <skill-id> --help 查看参数，再用 remixmate <skill-id> --json-output ... 执行。可用技能：remixmate --list。

完整介绍页（Claude Code / Codex 配置、环境变量、端到端工作流示例）见项目主页。

认证

推荐方式（人类用户）：浏览器设备登录，无需手动粘贴 token：

remixmate login     # 在浏览器确认授权，凭证安全保存到本机
remixmate whoami    # 查看当前身份（绝不打印 token）
remixmate logout    # 从本机移除已存储的凭证

login 使用 OAuth 2.0 设备授权流程（RFC 8628）：CLI 显示设备码，你在已登录 Web 的浏览器中确认，CLI 随后取回凭证并保存到系统钥匙串（或 ~/.config/remixmate/credentials.json，权限 0600）。仅在交互式终端中可用。

CI 与 agent 宿主（ab-agent / Claude Code）继续使用 PRIV_TOKEN 环境变量。凭证解析优先级：

--token 参数  >  PRIV_TOKEN 环境变量  >  本地已存凭证（remixmate login 写入）

设置了 PRIV_TOKEN 时，login 会跳过，且任何命令都不会自动触发设备登录流程。

安全提示：若你此前曾把 PRIV_TOKEN 粘贴到聊天框或写进 shell 历史，切换到 remixmate login 后建议轮换该 token。

环境

多数技能通过 PRIV_TOKEN 向 ab-api 鉴权。没有有效 token（以及访问 ab-api 的网络）时，模板 / 媒体生成类技能不可用——代码是开源的，但生成能力托管在 ab-api 服务上。运行前把 .env.example 拷为 .env 并 source：

cp .env.example .env
# 修改其中的值
source .env

Python 技能（11 个中的 6 个）需要 python3 >= 3.10。web-capture 需要 Playwright（首次运行自动安装 chromium）。ffmpeg 仅 video-parser 的可选本地工具（deconstruct_video.py）需要；video-parser 默认入口走 ab-render 服务端解构，无需本地 ffmpeg。

技能

本项目包含 11 个 AI 媒体生成技能，覆盖从素材生成、脚本编排、模板绑定、视频渲染到剪映导出的完整视频内容生产链路。

技能分层

┌─────────────────────────────────────────────────────────────┐
│ 编排层 Skills                                                │
│  gen-script           主题 → Video DSL（脚本生成）           │
│  template-registry        DSL → TemplateBinding（模板列表）      │
│  prepare-video-assets DSL + Binding → 素材补齐（Phase 1）    │
│  render-video         RenderPlan → Remotion 渲染（Phase 3）  │
│  export-jianying      素材 → 剪映草稿 ZIP                    │
├─────────────────────────────────────────────────────────────┤
│ 原子层 Skills                                                │
│  gen-image         文生图 / 图生图（Seedream / Gemini）      │
│  gen-video         文生视频（Seedance / Veo）                │
│  gen-voice         语音合成（Minimax TTS）                   │
│  gen-digital-human 数字人口播（即梦 / 飞影）                 │
├─────────────────────────────────────────────────────────────┤
│ 工具层 Skills                                                │
│  video-parser      视频解构（音频提取 / ASR / 关键帧）       │
│  web-capture       网页截图 / 滚动录屏 / 分镜视频            │
└─────────────────────────────────────────────────────────────┘

目录结构

├── docs/
│   └── video-production-architecture.md   # 架构文档
├── src/                        # TypeScript CLI + http/builtin handlers
├── skills/
│   ├── gen-image/              # 原子: AI 生图（http handler）
│   ├── gen-video/              # 原子: AI 生视频（http handler）
│   ├── gen-voice/              # 原子: 语音合成（http handler）
│   ├── gen-digital-human/      # 原子: 数字人口播（http handler）
│   ├── gen-script/             # 编排: 主题 → Video DSL
│   ├── template-registry/          # 编排: 模板列表（python list_templates.py）
│   ├── prepare-video-assets/   # 编排: Phase 1 素材准备（thin wrapper）
│   ├── render-video/           # 编排: Phase 3 Remotion 渲染（含 render_video.py 实现）
│   ├── export-jianying/        # 编排: 导出剪映草稿 ZIP
│   ├── video-parser/           # 工具: 视频解构与分析
│   └── web-capture/            # 工具: 无头浏览器截图 / 录屏
└── README.md

技能说明

| 技能 | 类型 | 说明 | 运行方式 / entry | |------|------|------|------------------| | gen-image | 原子 | 文生图 / 图生图（Seedream、Gemini） | http handler | | gen-video | 原子 | 文生视频（Seedance、Veo） | http handler | | gen-voice | 原子 | 语音合成（Minimax TTS） | http handler | | gen-digital-human | 原子 | 数字人口播（即梦 / 飞影） | http handler | | gen-script | 编排 | 主题 → Video DSL JSON | python scripts/gen_script.py | | template-registry | 编排 | 模板列表（绑定逻辑内嵌于 prepare-video-assets） | python scripts/list_templates.py | | prepare-video-assets | 编排 | DSL + Binding → 素材补齐 → 落库 RenderPlan | python scripts/prepare_video_assets.py（包装 render_video.py --resolve-only） | | render-video | 编排 | job_id → Remotion 渲染 → 上传 | python scripts/render_video.py | | export-jianying | 编排 | 素材 URL → 剪映草稿 ZIP（支持从 RenderPlan 自动转换） | python scripts/gen_jianying_draft.py | | video-parser | 工具 | 视频 → 音频 + ASR + 关键帧 + 场景分段 | python scripts/parse_via_render.py | | web-capture | 工具 | 网页截图 / 滚动录屏 / 分镜视频 | python scripts/screenshot.py、scripts/record.py |

核心链路

详见视频内容生产架构文档和编排流程指南。

链路 A：主题 → Remotion 视频

gen-script → ✅用户确认脚本 → prepare-video-assets(--template-id)
→ ✅用户确认素材 → render-video(--job-id) → MP4

链路 B：主题 → 剪映草稿

gen-script → ✅用户确认脚本 → prepare-video-assets(--template-id)
→ ✅用户确认素材 → export-jianying(--from-job-id) → 剪映 ZIP

测试

# 列出所有技能（名称、tool、entry 类型）
remixmate --list

# 离线注册表 smoke + 规范守卫
npm run smoke

# CLI 单元测试（argv 解析器 + skill schema）
npm run test:cli

# Python 技能会把 --help 透传给底层脚本：
remixmate gen-script --help
remixmate prepare-video-assets --help
remixmate render-video --help
remixmate export-jianying --help
remixmate video-parser --help
remixmate web-capture --help
remixmate template-registry --help

# http 技能（gen-image、gen-video、gen-voice、gen-digital-human）没有
# python --help；参数见各自的 SKILL.md / skill.json。

# 查看可用音色
remixmate gen-voice --list-voices

# 查看可用模板
remixmate template-registry --list-templates

开发流程

克隆此项目到本地
在 skills 目录下各技能文件夹中开发
每个技能包含 SKILL.md（技能说明）、version.json（元数据）和 scripts/（脚本）

快速体验

@skills/gen-image/SKILL.md 生成一张熊猫的图片，9:16，调用gemini 3.1，国画风 + 严格按该文档执行
@skills/gen-video/SKILL.md 生成一段熊猫在竹林奔跑的视频，9:16，长度6秒，调用veo + 严格按该文档执行
@skills/gen-voice/SKILL.md 生成一段语音，介绍熊猫的习性，大概100字左右 + 严格按该文档执行
@skills/gen-digital-human/SKILL.md 获取数字人列表 + 严格按该文档执行
@skills/template-registry/SKILL.md 获取模版列表 + 严格按该文档执行
@skills/gen-script/SKILL.md 基于模版 image-slide，创作一个关于AI学习方法的视频 + 严格按该文档执行

许可证

MIT

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme

@remixmate/cli

安装

在 Claude Code 中使用

在 Codex 中使用

认证

环境

技能

技能分层

目录结构

技能说明

核心链路

测试

开发流程

快速体验

许可证