llm-simple-router

v0.8.2

Published

a day ago

LLM API proxy router with OpenAI/Anthropic support, model mapping, retry strategies, and admin dashboard

Downloads

3,561

0High
0Medium
0Low

zhushanwen321

llm openai anthropic proxy router api-gateway

LLM Simple Router

LLM API 代理路由器。接收 Claude Code / Cursor 等客户端请求，通过模型映射和路由策略转发到配置的后端 Provider，支持流式（SSE）和非流式代理。

解决的核心问题：国产模型限流频繁、多供应商切换麻烦、并发控制缺失。

适合谁

用 Claude Code 配合国产模型（智谱、Moonshot、Minimax 等）的开发者
希望自动重试限流错误、分时段切换模型、控制并发排队
想要一个开箱即用的方案，不折腾

功能一览

| 功能 | 说明 | |------|------| | 自动重试 | 对 429/400/网络超时自动指数退避重试，默认针对智谱模型配置 | | 多供应商支持 | 智谱、Moonshot、Minimax、火山引擎、阿里云、腾讯云等，Coding Plan 选择后自动填写 | | 模型分时段映射 | 按时间段自动切换后端模型（如高峰期切到 Kimi，低谷期切回 GLM） | | 并发队列等待 | 按 Provider 配置并发数上限，超限请求排队等待 | | Failover 故障转移 | 多 Provider 互备，失败自动切换下一个 | | 实时请求监控 | SSE 推送活跃请求、队列状态、流式输出实时查看 | | 多密钥管理 | 独立密钥 + 模型白名单，支持多用户/多项目 | | 请求日志 | 四阶段完整链路（客户端请求/上游请求/上游响应/客户端响应） | | 性能指标 | TTFT、TPS、Token 用量、缓存命中率 |

API 兼容性： 支持 Anthropic 兼容 API（已适配 Claude Code）。OpenAI 兼容 API（/v1/chat/completions）尚未充分测试。

管理后台

| Provider 管理 + 并发控制 | 实时监控 | |---|---| | | Monitor |

| 模型映射 | 重试规则 | |---|---| | Mapping | Retry |

| Dashboard | 请求日志 | |---|---| | | Logs |

| 代理增强 (实验性) | |-----------------| | Proxy Enhancement |

快速开始

1. 启动 Router

npx llm-simple-router

访问 http://localhost:9981/admin ，首次进入 Setup 页面设置管理员密码。数据存储在 ~/.llm-simple-router/。

2. 配置 Provider

管理后台 > Provider 页面 > 添加 Provider。选择 Coding Plan 后会自动填写 Base URL，只需填入 API Key。

3. 配置模型映射

管理后台 > 模型映射页面。

核心概念： 客户端请求携带模型名 A，Router 根据映射规则将其替换为后端 Provider 支持的模型名 B，然后转发请求：

Claude Code (模型 A) → Router (A → B) → Provider API (模型 B)

只需在映射表中配置「客户端模型 = A，后端模型 = B，选择供应商」即可。

Claude Code 默认模型名

Claude Code 未设置环境变量时，默认使用以下模型名：opus、sonnet、haiku。如果后端是智谱 Coding Plan，映射配置如下：

| 客户端模型 | 后端模型 | 供应商 | 时间窗口 | |-----------|---------|--------|---------| | opus | glm-5.1 | 智谱 Coding Plan | 全天 | | sonnet | glm-5.1 | 智谱 Coding Plan | 全天 | | haiku | glm-5-turbo | 智谱 Coding Plan | 全天 |

也可以利用分时段功能实现高峰期自动切换：

| 客户端模型 | 后端模型 | 供应商 | 时间窗口 | |-----------|---------|--------|---------| | sonnet | glm-5.1 | 智谱 Coding Plan | 00:00-14:00 | | sonnet | kimi-for-coding | Moonshot | 14:00-18:00 | | sonnet | glm-5.1 | 智谱 Coding Plan | 18:00-24:00 |

4. 配置 Claude Code

在管理后台创建 Router API 密钥，然后选择一种方式配置。两种方式只需选其一。

方式一：shell alias（推荐）

最小配置，Claude Code 使用默认模型名（opus / sonnet / haiku），Router 通过映射表转换为后端模型：

alias clode='\
export ANTHROPIC_AUTH_TOKEN="<your-router-key>" && \
export ANTHROPIC_BASE_URL="http://127.0.0.1:9981" && \
claude'

也可以通过环境变量直接指定模型名，绕过 Router 映射：

alias clode='\
export ANTHROPIC_AUTH_TOKEN="sk-router-xxxxxxxx" && \
export ANTHROPIC_BASE_URL="http://192.168.1.111:9981" && \
export ANTHROPIC_MODEL="glm-5" && \
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.1" && \
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5" && \
export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-5-turbo" && \
export ANTHROPIC_SMALL_FAST_MODEL="glm-5-turbo" && \
claude'

调试时可加参数：claude --dangerously-skip-permissions --verbose --debug，或设置 export DEBUG=claude:* 查看详细日志。

方式二：~/.claude/settings.json

在 ~/.claude/settings.json 的 env 字段中配置，效果与 export 环境变量相同：

最小配置：

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "<your-router-key>",
    "ANTHROPIC_BASE_URL": "http://127.0.0.1:9981"
  }
}

覆盖模型名：

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-router-xxxxxxxx",
    "ANTHROPIC_BASE_URL": "http://192.168.1.111:9981",
    "ANTHROPIC_MODEL": "glm-5",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5-turbo",
    "ANTHROPIC_SMALL_FAST_MODEL": "glm-5-turbo"
  }
}

settings.json 中的环境变量对所有项目生效。如果只想对当前项目生效，可放在 .claude/settings.json（项目根目录下）。

5. 使用

# 方式一（shell alias）
clode

# 方式二（settings.json）
claude

Docker 部署

docker compose up -d

环境变量通过 Setup 页面设置，不需要 .env 文件。

进程管理

通过 Web UI 一键升级后，服务需要重启才能生效。推荐使用以下方式部署，确保进程崩溃或升级重启后自动恢复。

PM2（推荐）

# 安装 PM2
npm install -g pm2

# 全局安装 Router
npm install -g llm-simple-router

# 启动（PM2 自动重启崩溃的进程）
pm2 start llm-simple-router --name llm-router

# 查看日志
pm2 logs llm-router

# 设置开机自启
pm2 startup
pm2 save

升级流程：Web UI 一键升级 → 点击重启 → PM2 自动拉起新进程（< 1s 中断）。

systemd（Linux 服务器）

创建服务文件 /etc/systemd/system/llm-simple-router.service：

[Unit]
Description=LLM Simple Router
After=network.target

[Service]
Type=simple
ExecStart=/usr/local/bin/llm-simple-router
Restart=always
RestartSec=3
Environment=PORT=9981
Environment=LOG_LEVEL=info
# 按需配置其他环境变量
# Environment=DB_PATH=/var/lib/llm-simple-router/router.db

[Install]
WantedBy=multi-user.target

注意：ExecStart 路径取决于 Node.js 安装方式。用 which llm-simple-router 确认实际路径。

# 启用并启动
sudo systemctl enable llm-simple-router
sudo systemctl start llm-simple-router

# 查看状态和日志
sudo systemctl status llm-simple-router
journalctl -u llm-simple-router -f

升级流程：Web UI 一键升级 → 点击重启 → systemd 自动重启（< 1s 中断）。

npx / 手动启动

无需额外配置。Web UI 升级并点击重启后，Router 会自动 spawn 新进程并退出旧进程。短暂中断约 1-2 秒。

注意：如果直接 Ctrl+C 或终端关闭，服务不会自动恢复。建议生产环境使用 PM2 或 systemd。

工作原理

Claude Code → Router (模型映射 + 自动重试 + 并发控制) → 智谱 GLM / Kimi / 其他供应商

Router 根据模型映射找到后端供应商 → 转发请求 → 自动重试失败请求 → 记录日志和性能指标 → 返回响应。

架构图

系统上下文（详细说明）：

graph LR
    Clients["Claude Code / Cursor / 其他客户端"]
    Admin["管理员"]
    Router>"LLM Simple Router"]
    Providers>"智谱 / Moonshot / OpenAI / Anthropic / ..."]

    Clients -->|"API 请求<br/>Bearer Token"| Router
    Admin -->|"管理后台<br/>/admin/"| Router
    Router -->|"转发请求<br/>SSE 流式"| Providers

请求处理流水线（详细说明）：

flowchart LR
    A[客户端请求] --> B[认证]
    B --> C[模型映射<br/>+ 路由策略]
    C --> D[并发排队]
    D --> E[调用上游<br/>失败自动重试]
    E --> F[记录日志<br/>+ 指标]
    F --> G[返回响应]

    E -.->|失败| C

Router 收到请求后：认证 → 按映射规则找到后端 Provider → 排队控制并发 → 转发到上游（失败自动重试，Failover 策略下会切换 Provider）→ 记录日志和指标 → 返回响应。

环境变量

所有密钥通过 Setup 页面设置，以下为可选配置：

| 变量 | 默认值 | 说明 | |------|--------|------| | PORT | 9981 | 服务端口 | | DB_PATH | ~/.llm-simple-router/router.db | SQLite 数据库路径 | | LOG_LEVEL | info | 日志级别 | | TZ | Asia/Shanghai | 时区设置 | | STREAM_TIMEOUT_MS | 3000000 | 流式代理空闲超时（ms） | | RETRY_MAX_ATTEMPTS | 3 | 最大重试次数 | | RETRY_BASE_DELAY_MS | 1000 | 重试基础延迟（ms） |

开发

# 后端（热重载）
npm run dev

# 前端（热重载，代理 API 到后端 :9980）
cd frontend && npm run dev

# 构建
npm run build:full

# 测试
npm test

# Lint
npm run lint

License

MIT