npm package discovery and stats viewer.

Discover Tips

  • General search

    [free text search, go nuts!]

  • Package details

    pkg:[package-name]

  • User packages

    @[username]

Sponsor

Optimize Toolset

I’ve always been into building performant and accessible sites, but lately I’ve been taking it extremely seriously. So much so that I’ve been building a tool to help me optimize and monitor the sites that I build to make sure that I’m making an attempt to offer the best experience to those who visit them. If you’re into performant, accessible and SEO friendly sites, you might like it too! You can check it out at Optimize Toolset.

About

Hi, 👋, I’m Ryan Hefner  and I built this site for me, and you! The goal of this site was to provide an easy way for me to check the stats on my npm packages, both for prioritizing issues and updates, and to give me a little kick in the pants to keep up on stuff.

As I was building it, I realized that I was actually using the tool to build the tool, and figured I might as well put this out there and hopefully others will find it to be a fast and useful way to search and browse npm packages as I have.

If you’re interested in other things I’m working on, follow me on Twitter or check out the open source projects I’ve been publishing on GitHub.

I am also working on a Twitter bot for this site to tweet the most popular, newest, random packages from npm. Please follow that account now and it will start sending out packages soon–ish.

Open Software & Tools

This site wouldn’t be possible without the immense generosity and tireless efforts from the people who make contributions to the world and share their work via open source initiatives. Thank you 🙏

© 2026 – Pkg Stats / Ryan Hefner

omniroute

v3.2.8

Published

Smart AI Router with auto fallback — route to FREE & cheap models, zero downtime. Works with Cursor, Cline, Claude Desktop, Codex, and any OpenAI-compatible tool.

Readme

🚀 OmniRoute — Cổng AI miễn phí

Không bao giờ ngừng viết mã. Định tuyến thông minh tới Mô hình AI MIỄN PHÍ và chi phí thấp với tính năng dự phòng tự động.

Proxy API phổ quát của bạn — một điểm cuối, hơn 67 nhà cung cấp, không có thời gian ngừng hoạt động. Hiện có sự điều phối đại lý MCP & A2A.

Hoàn thành cuộc trò chuyện • Nhúng · Tạo hình ảnh · Video · Âm nhạc · Âm thanh · Sắp xếp lại · Tìm kiếm trên web · Máy chủ MCP · Giao thức A2A · 100% TypeScript


npm version npm downloads Docker Hub Docker Pulls License Website WhatsApp

🌐 Website🚀 Quick Start💡 Features📖 Docs💰 Pricing💬 WhatsApp

🌐 Có sẵn tại: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino | 🇨🇿 Čeština


🆕 Có gì mới trong v3.0.0

Nâng cấp từ v2.9.5? — Xem full CHANGELOG để biết tất cả các thay đổi.

| Khu vực | Thay đổi | | ---------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 🔒 Bảo mật CodeQL | Đã sửa hơn 10 cảnh báo CodeQL: đa thức-redos, không an toàn-ngẫu nhiên, khắc phục bằng cách tiêm shell | | ✅ Xác thực lộ trình | Tất cả 176 tuyến API hiện đã được xác thực bằng lược đồ Zod + validateBody() — CI check:route-validation:t06 vượt qua | | 🐛 Rò rỉ thẻ omniModel | Thẻ <omniModel> nội bộ không còn bị rò rỉ tới máy khách trong phản hồi phát trực tuyến SSE (#585) | | 🔑 API khóa đã đăng ký | Tự động cung cấp khóa API thông qua POST /api/v1/registered-keys với việc thực thi hạn ngạch cho mỗi nhà cung cấp/tài khoản, tính tạm thời, bộ nhớ SHA-256 và báo cáo sự cố GitHub tùy chọn | | 👁️ Scoped API Key Reveal 🆕 | Opt-in recovery of API keys via ALLOW_API_KEY_REVEAL | | 🎨 Biểu tượng nhà cung cấp | Hơn 130 logo nhà cung cấp thông qua @lobehub/icons (SVG) với PNG → chuỗi dự phòng chung | | 🔄 Tự động đồng bộ hóa mô hình | Bộ lập lịch 24 giờ và chuyển đổi giao diện người dùng thủ công để đồng bộ hóa danh sách mô hình cho các nhà cung cấp tương thích OpenAI tích hợp và tùy chỉnh | | 🌐 OpenCode Zen/Go | Hai nhà cung cấp mới từ @kang-heewon qua PR #530: bậc miễn phí + bậc đăng ký qua OpencodeExecutor | | 🐛 Gemini CLI OAuth | Lỗi có thể xử lý được khi thiếu GEMINI_OAUTH_CLIENT_SECRET trong Docker (là lỗi khó hiểu của Google) | | 🐛 Cấu hình OpenCode | saveOpenCodeConfig() hiện ghi TOML chính xác vào XDG_CONFIG_HOME | | 🐛 Ghi đè mô hình đã ghim | body.model được đặt chính xác thành pinnedModel về bảo vệ bộ nhớ đệm theo ngữ cảnh | | 🐛 Vòng lặp Codex/Claude | Các khối tool_result hiện đã được chuyển đổi thành văn bản để dừng các vòng lặp vô hạn | | 🐛 Chuyển hướng đăng nhập | Đăng nhập không còn bị treo sau khi bỏ qua thiết lập mật khẩu | | 🐛 Đường dẫn Windows | Đường dẫn MSYS2/Git-Bash (/c/...) được chuẩn hóa tự động thành C:\... |


🖼️ Bảng điều khiển chính


📸 Xem trước bảng điều khiển

| Trang | Ảnh chụp màn hình | | ------------------- | ------------------------------------------------- | | Nhà cung cấp | Providers | | Combo | Combos | | Phân tích | Analytics | | Sức khỏe | Health | | Người dịch | Translator | | Cài đặt | Settings | | Công cụ CLI | CLI Tools | | Nhật ký sử dụng | Usage | | Điểm cuối | Endpoints |


🤖 Nhà cung cấp AI miễn phí cho các tác nhân mã hóa yêu thích của bạn

Kết nối mọi công cụ IDE hoặc CLI được hỗ trợ bởi AI thông qua OmniRoute — cổng API miễn phí để mã hóa không giới hạn.

📡 Tất cả đại lý kết nối qua http://localhost:20128/v1 hoặc http://cloud.omniroute.online/v1 — một cấu hình, số mô hình và hạn ngạch không giới hạn


🤔 Tại sao lại là OmniRoute?

Ngưng lãng phí tiền và đạt đến giới hạn:

  • Hạn mức đăng ký hết hạn không được sử dụng hàng tháng
  • Giới hạn tốc độ khiến bạn không thể viết mã giữa chừng
  • API đắt tiền ($20-50/tháng cho mỗi nhà cung cấp)
  • Chuyển đổi thủ công giữa các nhà cung cấp

OmniRoute giải quyết vấn đề này:

  • Tối đa hóa số lượt đăng ký - Theo dõi hạn ngạch, sử dụng từng bit trước khi đặt lại
  • Tự động dự phòng - Đăng ký → Khóa API → Giá rẻ → Miễn phí, không có thời gian ngừng hoạt động
  • Nhiều tài khoản - Luân chuyển giữa các tài khoản cho mỗi nhà cung cấp
  • Universal - Hoạt động với Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, bất kỳ công cụ CLI nào

📧 Hỗ trợ

💬 Tham gia cộng đồng của chúng tôi! WhatsApp Group — Nhận trợ giúp, chia sẻ mẹo và luôn cập nhật.

🐛 Báo cáo lỗi?

Khi mở một vấn đề, vui lòng chạy lệnh system-info và đính kèm tệp được tạo:

npm run system-info

Điều này tạo ra system-info.txt với phiên bản Node.js, phiên bản OmniRoute, chi tiết hệ điều hành, các công cụ CLI đã cài đặt (iflow, gemini, claude, codex, antiGravity, droid, v.v.), trạng thái Docker/PM2 và các gói hệ thống — mọi thứ chúng tôi cần để tái tạo vấn đề của bạn một cách nhanh chóng. Đính kèm tệp trực tiếp vào vấn đề GitHub của bạn.


🔄 Nó hoạt động như thế nào

┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost

🎯 OmniRoute giải quyết được gì — 30 điểm khó thực sự và trường hợp sử dụng

Mọi nhà phát triển sử dụng công cụ AI đều phải đối mặt với những vấn đề này hàng ngày. OmniRoute được xây dựng để giải quyết tất cả — từ chi phí vượt mức cho đến chặn khu vực, từ luồng OAuth bị hỏng đến hoạt động giao thức và khả năng quan sát của doanh nghiệp.

Các nhà phát triển trả 20–200 USD/tháng cho Claude Pro, Codex Pro hoặc GitHub Copilot. Ngay cả khi trả tiền, hạn ngạch vẫn có mức trần - 5 giờ sử dụng, giới hạn hàng tuần hoặc giới hạn tốc độ mỗi phút. Giữa phiên mã hóa, nhà cung cấp ngừng phản hồi và nhà phát triển mất đi dòng chảy và năng suất.

Cách OmniRoute giải quyết vấn đề này:

  • Dự phòng 4 tầng thông minh — Nếu hết hạn ngạch đăng ký, tự động chuyển hướng đến Khóa API → Giá rẻ → Miễn phí mà không cần can thiệp thủ công
  • Theo dõi hạn ngạch theo thời gian thực — Hiển thị mức tiêu thụ mã thông báo trong thời gian thực với tính năng đếm ngược đặt lại (5 giờ, hàng ngày, hàng tuần)
  • Hỗ trợ nhiều tài khoản — Nhiều tài khoản cho mỗi nhà cung cấp với tính năng tự động quay vòng — khi hết một tài khoản, hãy chuyển sang tài khoản tiếp theo
  • Combo tùy chỉnh — Chuỗi dự phòng có thể tùy chỉnh với 6 chiến lược cân bằng (điền trước, quay vòng, P2C, ngẫu nhiên, ít sử dụng nhất, tối ưu hóa chi phí)
  • Hạn ngạch kinh doanh Codex — Giám sát hạn ngạch không gian làm việc của Doanh nghiệp/Nhóm trực tiếp trong bảng điều khiển

OpenAI sử dụng một định dạng, Claude (Anthropic) sử dụng một định dạng khác, Gemini lại sử dụng một định dạng khác. Nếu nhà phát triển muốn thử nghiệm các mô hình từ các nhà cung cấp khác nhau hoặc dự phòng giữa các nhà cung cấp đó, họ cần phải định cấu hình lại SDK, thay đổi điểm cuối, xử lý các định dạng không tương thích. Các nhà cung cấp tùy chỉnh (FriendLI, NIM) có các điểm cuối mô hình không chuẩn.

Cách OmniRoute giải quyết vấn đề này:

  • Điểm cuối hợp nhất — Một http://localhost:20128/v1 duy nhất đóng vai trò là proxy cho tất cả hơn 67 nhà cung cấp
  • Dịch định dạng — Tự động và minh bạch: OpenAI ↔ Claude ↔ Gemini ↔ API phản hồi
  • Sạch hóa phản hồi — Loại bỏ các trường không chuẩn (x_groq, usage_breakdown, service_tier) phá vỡ OpenAI SDK v1.83+
  • Chuẩn hóa vai trò — Chuyển đổi developersystem cho các nhà cung cấp không phải OpenAI; systemuser cho GLM/ERNIE
  • Think Tag Extraction — Trích xuất <think> khối từ các mô hình như DeepSeek R1 thành reasoning_content được tiêu chuẩn hóa
  • Đầu ra có cấu trúc cho Geminijson_schemaresponseMimeType/responseSchema chuyển đổi tự động
  • stream mặc định là false — Căn chỉnh với thông số OpenAI, tránh SSE không mong muốn trong SDK Python/Rust/Go

Các nhà cung cấp như OpenAI/Codex chặn quyền truy cập từ các khu vực địa lý nhất định. Người dùng gặp phải các lỗi như unsupported_country_region_territory trong khi kết nối OAuth và API. Điều này đặc biệt gây khó chịu cho các nhà phát triển từ các nước đang phát triển.

Cách OmniRoute giải quyết vấn đề này:

  • Cấu hình proxy 3 cấp — Proxy có thể định cấu hình ở 3 cấp độ: toàn cầu (tất cả lưu lượng truy cập), mỗi nhà cung cấp (chỉ một nhà cung cấp) và mỗi kết nối/khóa
  • Huy hiệu proxy được mã hóa màu — Chỉ báo trực quan: 🟢 proxy toàn cầu, 🟡 proxy nhà cung cấp, 🔵 proxy kết nối, luôn hiển thị IP
  • Trao đổi mã thông báo OAuth thông qua proxy — Luồng OAuth cũng đi qua proxy, giải quyết unsupported_country_region_territory
  • Kiểm tra kết nối qua Proxy — Kiểm tra kết nối sử dụng proxy đã định cấu hình (không cần bỏ qua trực tiếp nữa)
  • Hỗ trợ SOCKS5 — Hỗ trợ proxy SOCKS5 đầy đủ cho định tuyến đi
  • Giả mạo dấu vân tay TLS — Dấu vân tay TLS giống trình duyệt thông qua wreq-js để vượt qua khả năng phát hiện bot
  • 🔏 Khớp dấu vân tay CLI — Sắp xếp lại các tiêu đề và trường nội dung để khớp với chữ ký nhị phân CLI gốc, giảm đáng kể rủi ro gắn cờ tài khoản. IP proxy được giữ nguyên — bạn có được cả mặt nạ IP ẩn cùng lúc

Không phải ai cũng có thể trả 20–200 USD/tháng để đăng ký AI. Sinh viên, nhà phát triển từ các quốc gia mới nổi, những người có sở thích và người làm việc tự do cần được tiếp cận với các mô hình chất lượng với chi phí bằng 0.

Cách OmniRoute giải quyết vấn đề này:

  • Tích hợp sẵn nhà cung cấp cấp miễn phí — Hỗ trợ riêng cho nhà cung cấp miễn phí 100%: iFlow (5 mô hình không giới hạn qua OAuth: kimi-k2-thinking, qwen3-code-plus, deepseek-r1, minimax-m2, kimi-k2), Qwen (4 mô hình không giới hạn: qwen3-code-plus, qwen3-code-flash, qwen3-code-next, Vision-model), Kiro (Claude + AWS Builder ID miễn phí), Gemini CLI (miễn phí 180K token/tháng)
  • Ollama Cloud — Các mô hình Ollama được lưu trữ trên đám mây tại api.ollama.com với bậc "Sử dụng nhẹ" miễn phí; sử dụng tiền tố ollamacloud/<model>
  • Combo chỉ miễn phí — Chuỗi gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = $0/tháng mà không có thời gian ngừng hoạt động
  • Truy cập miễn phí NVIDIA NIM — ~40 RPM dành cho nhà phát triển - truy cập miễn phí vĩnh viễn vào hơn 70 mẫu tại build.nvidia.com (chuyển từ tín dụng sang giới hạn tỷ lệ thuần túy)
  • Chiến lược tối ưu hóa chi phí — Chiến lược định tuyến tự động chọn nhà cung cấp sẵn có rẻ nhất

Khi đưa cổng AI vào mạng (LAN, VPS, Docker), bất kỳ ai có địa chỉ đều có thể sử dụng mã thông báo/hạn ngạch của nhà phát triển. Nếu không có biện pháp bảo vệ, các API dễ bị lạm dụng, chèn ép và lạm dụng.

Cách OmniRoute giải quyết vấn đề này:

  • Quản lý khóa API — Tạo, xoay vòng và xác định phạm vi cho mỗi nhà cung cấp bằng trang /dashboard/api-manager chuyên dụng
  • Quyền cấp mô hình — Hạn chế khóa API đối với các mô hình cụ thể (openai/*, mẫu ký tự đại diện), bằng nút chuyển Cho phép tất cả/Hạn chế
  • Bảo vệ điểm cuối API — Yêu cầu khóa cho /v1/models và chặn các nhà cung cấp cụ thể khỏi danh sách
  • Auth Guard + CSRF Protection — Tất cả các tuyến trang tổng quan được bảo vệ bằng phần mềm trung gian withAuth + mã thông báo CSRF
  • Giới hạn tốc độ — Giới hạn tốc độ trên mỗi IP với các cửa sổ có thể định cấu hình
  • Lọc IP — Danh sách cho phép/danh sách chặn để kiểm soát truy cập
  • Prompt Tiêm Guard — Khử trùng các mẫu nhắc nhở độc hại
  • Mã hóa AES-256-GCM — Thông tin xác thực được mã hóa ở trạng thái lưu trữ

Các nhà cung cấp AI có thể trở nên không ổn định, trả về lỗi 5xx hoặc đạt giới hạn tốc độ tạm thời. Nếu một nhà phát triển phụ thuộc vào một nhà cung cấp duy nhất thì họ sẽ bị gián đoạn. Nếu không có bộ ngắt mạch, việc thử lại nhiều lần có thể làm hỏng ứng dụng.

Cách OmniRoute giải quyết vấn đề này:

  • Bộ ngắt mạch trên mỗi mô hình — Tự động mở/đóng với các ngưỡng và thời gian hồi chiêu có thể định cấu hình (Đóng/Mở/Nửa mở), trong phạm vi mỗi mô hình để tránh xếp tầng
  • Thời gian chờ theo cấp số nhân — Độ trễ thử lại lũy tiến
  • Bầy chống sấm sét — Mutex + bảo vệ semaphore chống lại các cơn bão thử lại đồng thời
  • Chuỗi dự phòng kết hợp — Nếu nhà cung cấp chính không thành công, nó sẽ tự động rơi qua chuỗi mà không cần can thiệp
  • Combo Circuit Breaker — Tự động vô hiệu hóa các nhà cung cấp bị lỗi trong chuỗi kết hợp
  • Bảng thông tin sức khỏe — Giám sát thời gian hoạt động, trạng thái ngắt mạch, khóa, số liệu thống kê bộ nhớ đệm, độ trễ p50/p95/p99

Nhà phát triển sử dụng Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Mỗi công cụ cần một cấu hình khác nhau (điểm cuối API, khóa, mô hình). Việc cấu hình lại khi chuyển đổi nhà cung cấp hoặc mô hình là một sự lãng phí thời gian.

Cách OmniRoute giải quyết vấn đề này:

  • Bảng điều khiển công cụ CLI — Trang chuyên dụng với thiết lập bằng một cú nhấp chuột cho Claude Code, Codex CLI, OpenClaw, Kilo Code, AntiGravity, Cline
  • Trình tạo cấu hình đồng lái GitHub — Tạo chatLanguageModels.json cho Mã VS với lựa chọn mô hình hàng loạt
  • Trình hướng dẫn tích hợp — Thiết lập 4 bước có hướng dẫn cho người dùng lần đầu
  • Một điểm cuối, tất cả các mô hình — Định cấu hình http://localhost:20128/v1 một lần, truy cập hơn 67 nhà cung cấp

Claude Code, Codex, Gemini CLI, Copilot — tất cả đều sử dụng OAuth 2.0 với các mã thông báo sắp hết hạn. Nhà phát triển cần liên tục xác thực lại, xử lý client_secret is missing, redirect_uri_mismatch và lỗi trên máy chủ từ xa. OAuth trên LAN/VPS đặc biệt có vấn đề.

Cách OmniRoute giải quyết vấn đề này:

  • Tự động làm mới mã thông báo — Làm mới mã thông báo OAuth ở chế độ nền trước khi hết hạn
  • Tích hợp OAuth 2.0 (PKCE) — Luồng tự động cho Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
  • OAuth nhiều tài khoản — Nhiều tài khoản cho mỗi nhà cung cấp thông qua trích xuất mã thông báo JWT/ID
  • OAuth LAN/Remote Fix — Phát hiện IP riêng cho redirect_uri + chế độ URL thủ công cho máy chủ từ xa
  • OAuth đằng sau Nginx — Sử dụng window.location.origin để tương thích với proxy ngược
  • Hướng dẫn OAuth từ xa — Hướng dẫn từng bước về thông tin đăng nhập Google Cloud trên VPS/Docker

Các nhà phát triển sử dụng nhiều nhà cung cấp trả phí nhưng không có quan điểm thống nhất về chi tiêu. Mỗi nhà cung cấp có trang tổng quan thanh toán riêng nhưng không có chế độ xem tổng hợp. Chi phí bất ngờ có thể chồng chất.

Cách OmniRoute giải quyết vấn đề này:

  • Bảng thông tin phân tích chi phí — Theo dõi chi phí mỗi mã thông báo và quản lý ngân sách cho mỗi nhà cung cấp
  • Giới hạn ngân sách cho mỗi cấp — Mức chi tiêu trần cho mỗi cấp kích hoạt dự phòng tự động
  • Cấu hình định giá theo mẫu — Giá có thể định cấu hình cho mỗi mẫu
  • Thống kê sử dụng trên mỗi khóa API — Số lượng yêu cầu và dấu thời gian được sử dụng lần cuối trên mỗi khóa
  • Bảng thông tin phân tích — Thẻ thống kê, biểu đồ sử dụng mô hình, bảng nhà cung cấp với tỷ lệ thành công và độ trễ

Khi cuộc gọi không thành công, nhà phát triển không biết liệu đó có phải là do giới hạn tốc độ, mã thông báo đã hết hạn, sai định dạng hay lỗi của nhà cung cấp hay không. Nhật ký bị phân mảnh trên các thiết bị đầu cuối khác nhau. Nếu không có khả năng quan sát được thì việc gỡ lỗi chỉ là thử và sai.

Cách OmniRoute giải quyết vấn đề này:

  • Bảng điều khiển nhật ký hợp nhất — 4 tab: Nhật ký yêu cầu, Nhật ký proxy, Nhật ký kiểm tra, Bảng điều khiển
  • Trình xem nhật ký bảng điều khiển — Trình xem kiểu thiết bị đầu cuối thời gian thực với các cấp độ được mã hóa màu, tự động cuộn, tìm kiếm, lọc
  • Nhật ký proxy SQLite — Nhật ký liên tục vẫn tồn tại khi máy chủ khởi động lại
  • Sân chơi dịch thuật — 4 chế độ gỡ lỗi: Sân chơi (dịch định dạng), Trình kiểm tra trò chuyện (khứ hồi), Bàn thử nghiệm (hàng loạt), Giám sát trực tiếp (thời gian thực)
  • Yêu cầu đo từ xa — độ trễ p50/p95/p99 + truy tìm X-Request-Id
  • Ghi nhật ký dựa trên tệp bằng xoay vòng — Trình chặn chặn bảng điều khiển ghi lại mọi thứ vào nhật ký JSON bằng cách xoay vòng dựa trên kích thước
  • Báo cáo thông tin hệ thốngnpm run system-info tạo system-info.txt với môi trường đầy đủ của bạn (Phiên bản nút, phiên bản OmniRoute, HĐH, công cụ CLI, trạng thái Docker/PM2). Đính kèm nó khi báo cáo vấn đề để phân loại ngay lập tức.

Việc cài đặt, định cấu hình và duy trì proxy AI trên các môi trường khác nhau (cục bộ, VPS, Docker, đám mây) tốn nhiều công sức. Các vấn đề như đường dẫn được mã hóa cứng, EACCES trên thư mục, xung đột cổng và bản dựng đa nền tảng sẽ gây thêm xích mích.

Cách OmniRoute giải quyết vấn đề này:

  • npm cài đặt toàn cầunpm install -g omniroute && omniroute — xong
  • Docker Đa nền tảng — AMD64 + ARM64 gốc (Apple Silicon, AWS Graviton, Raspberry Pi)
  • Hồ sơ soạn thảo Dockerbase (không có công cụ CLI) và cli (với Claude Code, Codex, OpenClaw)
  • Ứng dụng máy tính để bàn điện tử — Ứng dụng gốc dành cho Windows/macOS/Linux với khay hệ thống, tự động khởi động, chế độ ngoại tuyến
  • Chế độ chia cổng — API và Bảng điều khiển trên các cổng riêng biệt cho các tình huống nâng cao (proxy ngược, mạng vùng chứa)
  • Cloud Sync — Đồng bộ hóa cấu hình giữa các thiết bị thông qua Cloudflare Workers
  • Sao lưu DB — Tự động sao lưu, khôi phục, xuất và nhập tất cả cài đặt

Các đội ở các quốc gia không nói tiếng Anh, đặc biệt là ở Châu Mỹ Latinh, Châu Á và Châu Âu, gặp khó khăn với giao diện chỉ có tiếng Anh. Rào cản ngôn ngữ làm giảm khả năng tiếp nhận và tăng lỗi cấu hình.

Cách OmniRoute giải quyết vấn đề này:

  • Bảng điều khiển i18n — 30 ngôn ngữ — Tất cả hơn 500 phím được dịch bao gồm tiếng Ả Rập, tiếng Bungari, tiếng Đan Mạch, tiếng Đức, tiếng Tây Ban Nha, tiếng Phần Lan, tiếng Pháp, tiếng Do Thái, tiếng Hindi, tiếng Hungary, tiếng Indonesia, tiếng Ý, tiếng Nhật, tiếng Hàn, tiếng Mã Lai, tiếng Hà Lan, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha (PT/BR), tiếng Rumani, tiếng Nga, tiếng Slovak, tiếng Thụy Điển, tiếng Thái, tiếng Ukraina, tiếng Việt, tiếng Trung, tiếng Philipin, tiếng Anh
  • Hỗ trợ RTL — Hỗ trợ từ phải sang trái cho tiếng Ả Rập và tiếng Do Thái
  • README đa ngôn ngữ — 30 bản dịch tài liệu hoàn chỉnh
  • Bộ chọn ngôn ngữ — Biểu tượng quả cầu trong tiêu đề để chuyển đổi theo thời gian thực

AI không chỉ hoàn thành cuộc trò chuyện. Nhà phát triển cần tạo hình ảnh, phiên âm âm thanh, tạo phần nhúng cho RAG, sắp xếp lại tài liệu và kiểm duyệt nội dung. Mỗi API có điểm cuối và định dạng khác nhau.

Cách OmniRoute giải quyết vấn đề này:

  • Nhúng/v1/embeddings với 6 nhà cung cấp và hơn 9 mô hình
  • Tạo hình ảnh/v1/images/generations với 10 nhà cung cấp và hơn 20 mô hình (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, AntiGravity, SD WebUI, ComfyUI)
  • Chuyển văn bản thành video/v1/videos/generations — ComfyUI (AnimateDiff, SVD) và SD WebUI
  • Chuyển văn bản thành nhạc/v1/music/generations — ComfyUI (Mở âm thanh ổn định, MusicGen)
  • Phiên âm âm thanh/v1/audio/transcriptions — Whisper + Nvidia NIM, HuggingFace, Qwen3
  • Chuyển văn bản thành giọng nói/v1/audio/speech — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, Inworld, Cartesia, PlayHT, + các nhà cung cấp hiện có
  • Kiểm duyệt/v1/moderations — Kiểm tra an toàn nội dung
  • Sắp xếp lại/v1/rerank — Sắp xếp lại mức độ liên quan của tài liệu
  • API phản hồi — Hỗ trợ đầy đủ /v1/responses cho Codex

Các nhà phát triển muốn biết mô hình nào là tốt nhất cho trường hợp sử dụng của họ — mã, dịch thuật, lý luận — nhưng việc so sánh thủ công rất chậm. Không có công cụ đánh giá tích hợp nào tồn tại.

Cách OmniRoute giải quyết vấn đề này:

  • Đánh giá LLM — Bộ thử nghiệm vàng với 10 trường hợp tải sẵn bao gồm lời chào, toán, địa lý, tạo mã, tuân thủ JSON, dịch thuật, đánh dấu, từ chối an toàn
  • 4 Chiến lược kết hợpexact, contains, regex, custom (hàm JS)
  • Băng thử nghiệm sân chơi dịch giả — Thử nghiệm hàng loạt với nhiều đầu vào và đầu ra dự kiến, so sánh giữa các nhà cung cấp
  • Trình kiểm tra trò chuyện — Toàn bộ chuyến đi với kết xuất phản hồi trực quan
  • Live Monitor — Luồng thời gian thực của tất cả các yêu cầu truyền qua proxy

Khi khối lượng yêu cầu tăng lên mà không lưu vào bộ nhớ đệm thì các câu hỏi tương tự sẽ tạo ra chi phí trùng lặp. Nếu không có tính tạm thời, các yêu cầu trùng lặp sẽ bị lãng phí. Giới hạn tỷ lệ cho mỗi nhà cung cấp phải được tôn trọng.

Cách OmniRoute giải quyết vấn đề này:

  • Bộ nhớ đệm ngữ nghĩa — Bộ nhớ đệm hai tầng (chữ ký + ngữ nghĩa) giúp giảm chi phí và độ trễ
  • Yêu cầu Idempotency — Khoảng thời gian loại bỏ trùng lặp 5 giây cho các yêu cầu giống hệt nhau
  • Phát hiện giới hạn tỷ lệ — RPM của mỗi nhà cung cấp, khoảng cách tối thiểu và theo dõi đồng thời tối đa
  • Giới hạn tỷ lệ có thể chỉnh sửa — Giá trị mặc định có thể định cấu hình trong Cài đặt → Khả năng phục hồi với tính bền bỉ
  • Bộ đệm xác thực khóa API — Bộ đệm 3 tầng cho hiệu suất sản xuất
  • Bảng thông tin sức khỏe với phép đo từ xa — độ trễ p50/p95/p99, số liệu thống kê bộ nhớ đệm, thời gian hoạt động

Các nhà phát triển muốn tất cả phản hồi bằng một ngôn ngữ cụ thể, với giọng điệu cụ thể hoặc muốn giới hạn các mã thông báo lý luận. Việc định cấu hình điều này trong mọi công cụ/yêu cầu là không thực tế.

Cách OmniRoute giải quyết vấn đề này:

  • Tiêm nhắc nhở hệ thống — Lời nhắc chung được áp dụng cho tất cả các yêu cầu
  • Xác thực ngân sách tư duy — Kiểm soát phân bổ mã thông báo hợp lý cho mỗi yêu cầu (chuyển qua, tự động, tùy chỉnh, thích ứng)
  • 6 Chiến lược định tuyến — Chiến lược toàn cầu xác định cách phân phối yêu cầu
  • Bộ định tuyến ký tự đại diện — mẫu provider/* định tuyến động tới bất kỳ nhà cung cấp nào
  • Bật/Tắt kết hợp chuyển đổi — Chuyển đổi kết hợp trực tiếp từ bảng điều khiển
  • Chuyển đổi nhà cung cấp — Bật/tắt tất cả kết nối cho nhà cung cấp chỉ bằng một cú nhấp chuột
  • Nhà cung cấp bị chặn — Loại trừ các nhà cung cấp cụ thể khỏi danh sách /v1/models

Nhiều cổng AI chỉ hiển thị MCP dưới dạng chi tiết triển khai ẩn. Các nhóm cần một lớp hoạt động rõ ràng và dễ quản lý.

Cách OmniRoute giải quyết vấn đề này:

  • MCP xuất hiện trong tab điều hướng bảng điều khiển và giao thức điểm cuối
  • Trang quản lý MCP chuyên dụng với quy trình, công cụ, phạm vi và kiểm tra
  • Tích hợp sẵn tính năng khởi động nhanh cho omniroute --mcp và quá trình giới thiệu ứng dụng khách

Quy trình làm việc của tổng đài viên cần cả phản hồi trực tiếp và thực thi theo luồng trong thời gian dài với tính năng kiểm soát vòng đời.

Cách OmniRoute giải quyết vấn đề này:

  • Điểm cuối JSON-RPC A2A (POST /a2a) với message/sendmessage/stream
  • Truyền phát SSE với sự lan truyền trạng thái đầu cuối
  • API vòng đời tác vụ cho tasks/gettasks/cancel

Các nhóm vận hành cần biết liệu MCP có thực sự tồn tại hay không, chứ không chỉ là liệu API có thể truy cập được hay không.

Cách OmniRoute giải quyết vấn đề này:

  • Tệp nhịp tim thời gian chạy với PID, dấu thời gian, vận chuyển, số lượng công cụ và chế độ phạm vi
  • API trạng thái MCP kết hợp nhịp tim + hoạt động gần đây
  • Thẻ trạng thái giao diện người dùng về độ mới của quy trình/thời gian hoạt động/nhịp tim

Khi các công cụ thay đổi cấu hình hoặc kích hoạt các hành động vận hành, các nhóm cần truy xuất nguồn gốc pháp lý.

Cách OmniRoute giải quyết vấn đề này:

  • Ghi nhật ký kiểm tra được hỗ trợ bởi SQLite cho các lệnh gọi công cụ MCP
  • Bộ lọc theo công cụ, thành công/thất bại, khóa API và phân trang
  • Bảng kiểm tra bảng điều khiển + điểm cuối thống kê để tự động hóa

Các khách hàng khác nhau phải có quyền truy cập ít đặc quyền nhất vào các danh mục công cụ.

Cách OmniRoute giải quyết vấn đề này:

  • 9 phạm vi MCP chi tiết để truy cập công cụ được kiểm soát
  • Thực thi phạm vi và khả năng hiển thị trong giao diện người dùng quản lý MCP
  • Tư thế mặc định an toàn cho dụng cụ vận hành

Các nhóm cần thay đổi thời gian chạy nhanh trong các sự cố hoặc sự kiện tốn kém.

Cách OmniRoute giải quyết vấn đề này:

  • Chuyển đổi kích hoạt kết hợp trực tiếp từ bảng điều khiển MCP
  • Áp dụng hồ sơ khả năng phục hồi từ các gói chính sách được xác định trước
  • Đặt lại trạng thái ngắt mạch từ cùng bảng vận hành

Nếu không có khả năng hiển thị vòng đời, các sự cố trong nhiệm vụ sẽ khó phân loại.

Cách OmniRoute giải quyết vấn đề này:

  • Liệt kê/lọc nhiệm vụ theo trạng thái/kỹ năng với phân trang
  • Xem chi tiết về siêu dữ liệu, sự kiện và hiện vật của nhiệm vụ
  • Điểm cuối hủy tác vụ và hành động UI có xác nhận

Luồng công việc phát trực tuyến yêu cầu hiểu biết sâu sắc về hoạt động đồng thời và kết nối trực tiếp.

Cách OmniRoute giải quyết vấn đề này:

  • Bộ đếm luồng hoạt động được tích hợp vào trạng thái A2A
  • Dấu thời gian nhiệm vụ cuối cùng và số lượng trên mỗi trạng thái
  • Thẻ bảng điều khiển A2A để theo dõi hoạt động theo thời gian thực

Máy khách và người điều phối bên ngoài cần siêu dữ liệu có thể đọc được bằng máy để triển khai.

Cách OmniRoute giải quyết vấn đề này:

  • Thẻ đại lý bị lộ tại /.well-known/agent.json
  • Khả năng và kỹ năng thể hiện trong UI quản lý
  • API trạng thái A2A bao gồm siêu dữ liệu khám phá để tự động hóa

Nếu người dùng không thể khám phá các bề mặt giao thức, chất lượng chấp nhận và hỗ trợ sẽ giảm.

Cách OmniRoute giải quyết vấn đề này:

  • Trang Điểm cuối được hợp nhất với các tab dành cho Điểm cuối Proxy, MCP, A2A và API
  • Chuyển đổi trạng thái dịch vụ nội tuyến (Trực tuyến/Ngoại tuyến) cho MCP và A2A
  • Liên kết từ tổng quan đến các tab quản lý chuyên dụng

Các thử nghiệm mô phỏng không đủ để xác thực tính tương thích của giao thức trước khi phát hành.

Cách OmniRoute giải quyết vấn đề này:

  • Bộ E2E khởi động ứng dụng và sử dụng vận chuyển máy khách MCP SDK thực
  • Máy khách A2A kiểm tra các luồng khám phá, gửi, truyền phát, nhận và hủy
  • Kiểm tra chéo các xác nhận đối với kiểm tra MCP và API nhiệm vụ A2A

Việc phân chia khả năng quan sát theo giao thức sẽ tạo ra các điểm mù và MTTR dài hơn.

Cách OmniRoute giải quyết vấn đề này:

  • Bảng điều khiển/nhật ký/phân tích thống nhất trong một sản phẩm
  • Sức khỏe + kiểm toán + yêu cầu đo từ xa trên các lớp OpenAI, MCP và A2A
  • API hoạt động cho trạng thái và tự động hóa

Việc chạy nhiều dịch vụ riêng biệt làm tăng chi phí vận hành và các chế độ lỗi.

Cách OmniRoute giải quyết vấn đề này:

  • Proxy tương thích với OpenAI, máy chủ MCP và máy chủ A2A trong một ngăn xếp
  • Chia sẻ xác thực, khả năng phục hồi, lưu trữ dữ liệu và khả năng quan sát
  • Mô hình chính sách nhất quán trên tất cả các bề mặt tương tác

Các nhóm bị mất tốc độ khi kết hợp nhiều dịch vụ và tập lệnh đặc biệt.

Cách OmniRoute giải quyết vấn đề này:

  • Chiến lược điểm cuối thống nhất cho khách hàng và đại lý
  • Giao diện người dùng quản lý giao thức tích hợp và đường dẫn xác thực khói
  • Nền tảng sẵn sàng sản xuất (bảo mật, ghi nhật ký, khả năng phục hồi, sao lưu)

Sách hướng dẫn ví dụ (Trường hợp sử dụng tích hợp)

Playbook A: Tối đa hóa đăng ký trả phí + dự phòng giá rẻ

Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption

Playbook B: Ngăn xếp mã hóa không tốn phí

Combo: "free-forever"
  1. gc/gemini-3-flash
  2. if/kimi-k2-thinking
  3. qw/qwen3-coder-plus

Monthly cost: $0
Outcome: stable free coding workflow

Playbook C: chuỗi dự phòng luôn hoạt động 24/7

Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads

Playbook D: Tác nhân hoạt động với MCP + A2A

1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/endpoint (MCP and A2A tabs)
4) Toggle services via inline status controls

🆓 Bắt đầu miễn phí - Chi phí cấu hình bằng 0

Thiết lập mã hóa AI trong vài phút với mức $0/tháng. Kết nối các tài khoản miễn phí này và sử dụng combo Free Stack tích hợp sẵn.

| Bước | Hành động | Nhà cung cấp đã được mở khóa | | ---- | ---------------------------------------------------- | ---------------------------------------------------------------------- | | 1 | Kết nối Kiro (ID AWS Builder OAuth) | Claude Sonnet 4.5, Haiku 4.5 — không giới hạn | | 2 | Kết nối iFlow (Google OAuth) | kimi-k2-thinking, qwen3-code-plus, deepseek-r1... — không giới hạn | | 3 | Kết nối Qwen (Mã thiết bị) | qwen3-code-plus, qwen3-code-flash... — không giới hạn | | 4 | Kết nối Gemini CLI (Google OAuth) | gemini-3-flash, gemini-2.5-pro — 180K/tháng miễn phí | | 5 | /dashboard/combosMẫu ngăn xếp miễn phí ($0) | Tự động quay vòng tất cả các nhà cung cấp miễn phí |

Trỏ bất kỳ IDE/CLI nào tới: http://localhost:20128/v1 · Khóa API: any-string · Xong.

Phạm vi phủ sóng bổ sung tùy chọn (cũng miễn phí): Khóa API Groq (miễn phí 30 RPM), NVIDIA NIM (miễn phí 40 RPM, hơn 70 mẫu), Cerebras (1 triệu tok/ngày), khóa API LongCat (50 triệu mã thông báo/ngày!), Cloudflare Workers AI (10K nơ-ron/ngày, hơn 50 mô hình).

⚡ Bắt đầu nhanh

1) Cài đặt và chạy

npm install -g omniroute
omniroute

người dùng pnpm: Chạy pnpm approve-builds -g sau khi cài đặt để bật tập lệnh bản dựng gốc được yêu cầu bởi better-sqlite3@swc/core:

pnpm install -g omniroute
pnpm approve-builds -g   # Select all packages → approve
omniroute

Trang tổng quan mở tại http://localhost:20128 và URL cơ sở API là http://localhost:20128/v1.

| Lệnh | Mô tả | | ----------------------- | --------------------------------------------------------------------------- | | omniroute | Khởi động máy chủ (PORT=20128, API và bảng điều khiển trên cùng một cổng) | | omniroute --port 3000 | Đặt cổng chuẩn/API thành 3000 | | omniroute --mcp | Khởi động máy chủ MCP (stdio Transport) | | omniroute --no-open | Không tự động mở trình duyệt | | omniroute --help | Hiển thị trợ giúp |

Chế độ chia cổng tùy chọn:

PORT=20128 DASHBOARD_PORT=20129 omniroute
# API:       http://localhost:20128/v1
# Dashboard: http://localhost:20129

2) Kết nối nhà cung cấp và tạo khóa API của bạn

  1. Mở Trang tổng quan → Providers và kết nối ít nhất một nhà cung cấp (khóa OAuth hoặc API).
  2. Mở Trang tổng quan → Endpoints và tạo khóa API.
  3. (Tùy chọn) Mở Trang tổng quan → Combos và đặt chuỗi dự phòng của bạn.

3) Trỏ công cụ mã hóa của bạn tới OmniRoute

Base URL: http://localhost:20128/v1
API Key:  [copy from Endpoint page]
Model:    if/kimi-k2-thinking (or any provider/model prefix)

Hoạt động với Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode và SDK tương thích với OpenAI.

4) Kích hoạt và xác thực các giao thức (v2.0)

MCP (đối với các hoạt động điều khiển bằng công cụ):

omniroute --mcp

Sau đó kết nối ứng dụng khách MCP của bạn qua stdio và kiểm tra các công cụ như:

  • omniroute_get_health
  • omniroute_list_combos

A2A (dành cho quy trình làm việc giữa các đại lý):

curl http://localhost:20128/.well-known/agent.json
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'

5) Xác thực mọi thứ từ đầu đến cuối (được khuyến nghị)

npm run test:protocols:e2e

Bộ phần mềm này xác thực các luồng ứng dụng khách MCP và A2A thực dựa trên ứng dụng đang chạy.

Cách khác: chạy từ nguồn

cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev

🐳 Docker

OmniRoute có sẵn dưới dạng hình ảnh Docker công khai trên Docker Hub.

Chạy nhanh:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Với tệp môi trường:

# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Sử dụng Docker Compose:

# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d

| Hình ảnh | Gắn thẻ | Kích thước | Mô tả | | ------------------------ | -------- | ---------- | ------------------------------ | | diegosouzapw/omniroute | latest | ~250MB | Bản phát hành ổn định mới nhất | | diegosouzapw/omniroute | 1.0.3 | ~250MB | Phiên bản hiện tại |


🖥️ Ứng dụng dành cho máy tính để bàn — Ngoại tuyến & Luôn bật

🆕 MỚI! OmniRoute hiện có sẵn dưới dạng ứng dụng máy tính để bàn gốc dành cho Windows, macOS và Linux.

Chạy OmniRoute dưới dạng một ứng dụng máy tính để bàn độc lập — không cần thiết bị đầu cuối, không cần trình duyệt, không cần Internet đối với các mô hình cục bộ. Ứng dụng dựa trên Electron bao gồm:

  • 🖥️ Cửa sổ gốc — Cửa sổ ứng dụng chuyên dụng có tích hợp khay hệ thống
  • 🔄 Tự động khởi động — Khởi chạy OmniRoute khi đăng nhập hệ thống
  • 🔔 Thông báo gốc — Nhận thông báo về tình trạng cạn kiệt hạn ngạch hoặc các vấn đề về nhà cung cấp
  • Cài đặt bằng một cú nhấp chuột — NSIS (Windows), DMG (macOS), AppImage (Linux)
  • 🌐 Chế độ ngoại tuyến — Hoạt động hoàn toàn ngoại tuyến với máy chủ đi kèm

Bắt đầu nhanh

# Development mode
npm run electron:dev

# Build for your platform
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg) — x64 & arm64
npm run electron:build:linux   # Linux (.AppImage)

Khay hệ thống

Khi được thu nhỏ, OmniRoute sẽ tồn tại trong khay hệ thống của bạn bằng các hành động nhanh chóng:

  • Mở bảng điều khiển
  • Thay đổi cổng máy chủ
  • Thoát khỏi ứng dụng

📖 Tài liệu đầy đủ: OMNI_TOKEN_153


💰 Sơ lược về giá

| Bậc | Nhà cung cấp | Chi phí | Đặt lại hạn ngạch | Tốt nhất cho | | --------------- | --------------------------- | -------------------------------- | ---------------------- | ----------------------------------------- | | 💳 ĐĂNG KÝ | Mã Claude (Pro) | $20/tháng | 5h + hàng tuần | Đã đăng ký | | | Codex (Plus/Pro) | $20-200/tháng | 5h + hàng tuần | Người dùng OpenAI | | | Song Tử CLI | MIỄN PHÍ | 180K/tháng + 1K/ngày | Mọi người! | | | Phi công phụ GitHub | $10-19/tháng | Hàng tháng | Người dùng GitHub | | 🔑 KHÓA API | NVIDIA NIM | MIỄN PHÍ (dev mãi mãi) | ~40 vòng/phút | Hơn 70 mô hình mở | | | Não | MIỄN PHÍ (1 triệu tok/ngày) | 60K TPM / 30 vòng/phút | Nhanh nhất thế giới | | | Groq | MIỄN PHÍ (30 vòng/phút) | 14,4K RPD | Llama/Gemma cực nhanh | | | DeepSeek V3.2 | 0,27 USD/1,10 USD mỗi 1 triệu | Không có | Lý luận về giá/chất lượng tốt nhất | | | xAI Grok-4 Nhanh | $0,20/$0,50 mỗi 1 triệu 🆕 | Không có | Gọi công cụ + nhanh nhất, cực nhanh | | | xAI Grok-4 (tiêu chuẩn) | 0,20 USD/1,50 USD mỗi 1 triệu 🆕 | Không có | Lý luận hàng đầu từ xAI | | | Mistral | Dùng thử miễn phí + trả phí | Tỷ lệ giới hạn | AI Châu Âu | | | OpenRouter | Trả tiền cho mỗi lần sử dụng | Không có | Tổng hợp hơn 100 mô hình | | 💰 RẺ | GLM-5 (thông qua Z.AI) 🆕 | 0,5 USD/1 triệu USD | 10 giờ sáng hàng ngày | Đầu ra 128K, chiếc hạm mới nhất | | | GLM-4.7 | 0,6 USD/1 triệu USD | 10 giờ sáng hàng ngày | Dự phòng ngân sách | | | MiniMax M2.5 🆕 | 0,3 USD/đầu vào 1 triệu USD | lăn 5 giờ | Lý luận + nhiệm vụ tác nhân | | | MiniMax M2.1 | 0,2 USD/1 triệu USD | lăn 5 giờ | Lựa chọn rẻ nhất | | | Kimi K2.5 (API Moonshot) 🆕 | Trả tiền cho mỗi lần sử dụng | Không có | Truy cập API Moonshot trực tiếp | | | Kimi K2 | $9/tháng căn hộ | 10 triệu token/tháng | Chi phí dự đoán | | 🆓 MIỄN PHÍ | iFlow | $0 | Không giới hạn | 5 mẫu không giới hạn | | | Qwen | $0 | Không giới hạn | 4 mẫu không giới hạn | | | Kiro | $0 | Không giới hạn | Claude Sonnet/Haiku (Người xây dựng AWS) | | | LongCat Flash-Lite 🆕 | $0 (50 triệu tok/ngày 🔥) | 1 RPS | Hạn ngạch miễn phí lớn nhất trên Trái đất | | | Thụ phấn AI 🆕 | $0 (không cần chìa khóa) | 1 yêu cầu/15 giây | GPT-5, Claude, DeepSeek, Llama 4 | | | Cloudflare Workers AI 🆕 | $0 (10K nơ-ron/ngày) | ~150 lần/ngày | Hơn 50 mẫu, lợi thế toàn cầu | | | Đường quy mô AI 🆕 | $0 (Tổng số 1 triệu token) | Tỷ lệ giới hạn | EU/GDPR, Qwen3 235B, Llama 70B |

🆕 Thêm các mẫu mới (tháng 3 năm 2026): Dòng Grok-4 Fast ở mức 0,20 USD/0,50 USD/M (điểm chuẩn ở 1143 mili giây — nhanh hơn 30% so với Gemini 2.5 Flash), GLM-5 qua Z.AI với đầu ra 128K, lý luận MiniMax M2.5, giá cập nhật DeepSeek V3.2, Kimi K2.5 qua API trực tiếp Moonshot.

💡 Ngăn xếp combo $0 — Thiết lập miễn phí hoàn chỉnh:

# 🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever
Kiro (kr/)             → Claude Sonnet/Haiku UNLIMITED
iFlow (if/)            → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/)     → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/)    → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/)             → qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED
Gemini (gemini/)       → Gemini 2.5 Flash — 1,500 req/day free API key
Cloudflare AI (cf/)    → Llama 70B, Gemma 3, Mistral — 10K Neurons/day
Scaleway (scw/)        → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/)           → Llama/Gemma ultra-fast — 14.4K req/day
NVIDIA NIM (nvidia/)   → 70+ open models — 40 RPM forever
Cerebras (cerebras/)   → Llama/Qwen world-fastest — 1M tok/day

** Không tốn phí. Không bao giờ ngừng mã hóa.** Định cấu hình tính năng này dưới dạng một tổ hợp OmniRoute và tất cả các dự phòng sẽ tự động diễn ra — không cần chuyển đổi thủ công.



🆓 Mô hình miễn phí — Những gì bạn thực sự nhận được

Tất cả các mẫu bên dưới đều miễn phí 100% và không cần thẻ tín dụng. OmniRoute tự động định tuyến giữa chúng khi hết một hạn mức — kết hợp tất cả chúng để tạo thành một combo $0 không thể phá vỡ.

🔵 MÔ HÌNH CLAUDE (thông qua Kiro — ID AWS Builder)

| Người mẫu | Tiền tố | Giới hạn | Giới hạn tỷ lệ | | ------------------- | ------- | ------------------ | ---------------------------------------- | | claude-sonnet-4.5 | kr/ | Không giới hạn | Không có giới hạn hàng ngày được báo cáo | | claude-haiku-4.5 | kr/ | Không giới hạn | Không có giới hạn hàng ngày được báo cáo | | claude-opus-4.6 | kr/ | Không giới hạn | Opus mới nhất qua Kiro |

🟢 MÔ HÌNH IFLOW (OAuth miễn phí - Không có thẻ tín dụng)

| Người mẫu | Tiền tố | Giới hạn | Giới hạn tỷ lệ | | ------------------ | ------- | ------------------ | ------------------------------ | | kimi-k2-thinking | if/ | Không giới hạn | Không có giới hạn được báo cáo | | qwen3-coder-plus | if/ | Không giới hạn | Không có giới hạn được báo cáo | | deepseek-r1 | if/ | Không giới hạn | Không có giới hạn được báo cáo | | minimax-m2.1 | if/ | Không giới hạn | Không có giới hạn được báo cáo | | kimi-k2 | if/ | Không giới hạn | Không có giới hạn được báo cáo |

🟡 MÔ HÌNH QWEN (Xác thực mã thiết bị)

| Người mẫu | Tiền tố | Giới hạn | Giới hạn tỷ lệ | | ------------------- | ------- | ------------------ | ------------------------------ | | qwen3-coder-plus | qw/ | Không giới hạn | Không có giới hạn được báo cáo | | qwen3-coder-flash | qw/ | Không giới hạn | Không có giới hạn được báo cáo | | qwen3-coder-next | qw/ | Không giới hạn | Không có giới hạn được báo cáo | | vision-model | qw/ | Không giới hạn | Đa phương thức (hình ảnh) |

🟣 GEMINI CLI (Google OAuth)

| Người mẫu | Tiền tố | Giới hạn | Giới hạn tỷ lệ | | ------------------------ | ------- | ---------------------------- | ------------------ | | gemini-3-flash-preview | gc/ | 180K tok/tháng + 1K/ngày | Đặt lại hàng tháng | | gemini-2.5-pro | gc/ | 180K/tháng (nhóm chung) | Chất lượng cao |

⚫ NVIDIA NIM (Khóa API miễn phí - build.nvidia.com)

| Bậc | Giới hạn hàng ngày | Giới hạn tỷ lệ | Ghi chú | | ------------------------- | ------------------------------ | ----------------- | --------------------------------------------------------------------- | | Miễn phí (Nhà phát triển) | Không có giới hạn mã thông báo | ~40 vòng/phút | Hơn 70 mẫu; chuyển sang giới hạn lãi suất thuần túy vào giữa năm 2025 |

Các mẫu miễn phí phổ biến: moonshotai/kimi-k2.5 (Kimi K2.5), z-ai/glm4.7 (GLM 4.7), deepseek-ai/deepseek-v3.2 (DeepSeek V3.2), nvidia/llama-3.3-70b-instruct, deepseek/deepseek-r1

⚪ CEREBRAS (Khóa API miễn phí — inference.cerebras.ai)

| Bậc | Giới hạn hàng ngày | Giới hạn tỷ lệ | Ghi chú | | -------- | ---------------------- | ---------------------- | --------------------------------------------------- | | Miễn phí | 1 triệu token/ngày | 60K TPM / 30 vòng/phút | Suy luận LLM nhanh nhất thế giới; đặt lại hàng ngày |

Có sẵn miễn phí: llama-3.3-70b, llama-3.1-8b, deepseek-r1-distill-llama-70b

🔴 GROQ (Khóa API miễn phí — console.groq.com)

| Bậc | Giới hạn hàng ngày | Giới hạn tỷ lệ | Ghi chú | | -------- | ------------------ | ------------------------ | ------------------------------------------------------ | | Miễn phí | 14,4K RPD | 30 vòng/phút cho mỗi mẫu | Không có thẻ tín dụng; Giới hạn 429, không bị tính phí |

Có sẵn miễn phí: llama-3.3-70b-versatile, gemma2-9b-it, mixtral-8x7b, whisper-large-v3

🔴 LONGCAT AI (Khóa API miễn phí - longcat.chat) 🆕

| Người mẫu | Tiền tố | Hạn ngạch miễn phí hàng ngày | Ghi chú | | ----------------------------- | ------- | ---------------------------- | ---------------------------------------------- | | LongCat-Flash-Lite | lc/ | 50 triệu token 🔥 | Hạn ngạch miễn phí lớn nhất từ ​​trước đến nay | | LongCat-Flash-Chat | lc/ | 500K token | Trò chuyện nhiều lượt | | LongCat-Flash-Thinking | lc/ | 500K token | Lý luận / CoT | | LongCat-Flash-Thinking-2601 | lc/ | 500K token | Phiên bản tháng 1 năm 2026 | | LongCat-Flash-Omni-2603 | lc/ | 500K token | Đa phương thức |

Miễn phí 100% khi ở phiên bản beta công khai. Đăng ký tại longcat.chat bằng email hoặc điện thoại. Đặt lại 00:00 UTC hàng ngày.

🟢 THỤ CẤP AI (Không cần khóa API) 🆕

| Người mẫu | Tiền tố | Giới hạn tỷ lệ | Nhà cung cấp đằng sau | | ---------- | ------- | ----------------- | ---------------------- | | openai | pol/ | 1 yêu cầu/15 giây | GPT-5 | | claude | pol/ | 1 yêu cầu/15 giây | Claude nhân loại | | gemini | pol/ | 1 yêu cầu/15 giây | Google Song Tử | | deepseek | pol/ | 1 yêu cầu/15 giây | DeepSeek V3 | | llama | pol/ | 1 yêu cầu/15 giây | Hướng đạo Meta Llama 4 | | mistral | pol/ | 1 yêu cầu/15 giây | AI của Mistral |

Không ma sát: Không cần đăng ký, không cần khóa API. Thêm nhà cung cấp Pollinations với trường khóa trống và nó sẽ hoạt động ngay lập tức.

🟠 NHÂN VIÊN CLOUDFLARE AI (Khóa API miễn phí - cloudflare.com) 🆕

| Bậc | Tế bào thần kinh hàng ngày | Cách sử dụng tương đương | Ghi chú | | -------- | -------------------------- | -------------------------------------------------- | ------------------------- | | Miễn phí | 10.000 | ~150 LLM resp / âm thanh 500 giây / 15K lượt nhúng | Cạnh toàn cầu, hơn 50 mẫu |

Các mẫu miễn phí phổ biến: @cf/meta/llama-3.3-70b-instruct, @cf/google/gemma-3-12b-it, @cf/openai/whisper-large-v3-turbo (âm thanh miễn phí!), @cf/qwen/qwen2.5-coder-15b-instruct

Yêu cầu Mã thông báo API + ID tài khoản từ dash.cloudflare.com. Lưu trữ ID tài khoản trong cài đặt nhà cung cấp.

🟣 SCALEWAY AI (Mã thông báo miễn phí 1 triệu —scaleway.com) 🆕

| Bậc | Hạn ngạch miễn phí | Vị trí | Ghi chú | | -------- | ------------------ | ------------ | ------------------------------------- | | Miễn phí | 1 triệu token | 🇫🇷 Paris, EU | Không cần thẻ tín dụng trong giới hạn |

Có sẵn miễn phí: qwen3-235b-a22b-instruct-2507 (Qwen3 235B!), llama-3.1-70b-instruct, mistral-small-3.2-24b-instruct-2506, deepseek-v3-0324

Tuân thủ EU/GDPR. Nhận khóa API tại console.scaleway.com.

💡 Kho miễn phí tối ưu (11 nhà cung cấp, $0 vĩnh viễn):

Kiro (kr/)             → Claude Sonnet/Haiku UNLIMITED
iFlow (if/)            → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/)     → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/)    → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/)             → qwen3-coder models UNLIMITED
Gemini (gemini/)       → Gemini 2.5 Flash — 1,500 req/day free
Cloudflare AI (cf/)    → 50+ models — 10K Neurons/day
Scaleway (scw/)        → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/)           → Llama/Gemma — 14.4K req/day ultra-fast
NVIDIA NIM (nvidia/)   → 70+ open models — 40 RPM forever
Cerebras (cerebras/)   → Llama/Qwen world-fastest — 1M tok/day

🎙️ Combo phiên âm miễn phí

Phiên âm mọi âm thanh/video với giá $0 — Deepgram dẫn đầu với 200 USD miễn phí, dự phòng AssemblyAI 50 USD, Groq Whisper làm bản sao lưu khẩn cấp không giới hạn.

| Nhà cung cấp | Tín dụng miễn phí | Người Mẫu Tốt Nhất | Giới hạn tỷ lệ | | ------------------ | --------------------------- | ------------------------------------------------- | ----------------------------------------------- | | 🟢 Deepgram | $200 miễn phí (đăng ký) | nova-3 — độ chính xác tốt nhất, hơn 30 ngôn ngữ | Không có giới hạn RPM đối với tín dụng miễn phí | | 🔵 HộiAI | $50 miễn phí (đăng ký) | universal-3-pro — chương, tình cảm, PII | Không có giới hạn RPM đối với tín dụng miễn phí | | 🔴 Ngốc nghếch | Miễn phí mãi mãi | whisper-large-v3 — Lời thì thầm của OpenAI | 30 vòng/phút (tốc độ giới hạn) |

Kết hợp được đề xuất trong /dashboard/combos:

Name: free-transcription
Strategy: Priority
Nodes:
  [1] deepgram/nova-3          → uses $200 free first
  [2] assemblyai/universal-3-pro → fallback when Deepgram credits run out
  [3] groq/whisper-large-v3    → free forever, emergency fallback

Sau đó, trong tab /dashboard/mediaPhiên âm: tải lên bất kỳ tệp âm thanh hoặc video nào → chọn điểm cuối kết hợp của bạn → nhận phiên âm ở các định dạng được hỗ trợ.

💡 Tính năng chính

OmniRoute v2.0 được xây dựng như một nền tảng hoạt động, không chỉ là proxy chuyển tiếp.

🆕 Mới — Cải tiến lấy cảm hứng từ ClawRouter (Tháng 3 năm 2026)

| Tính năng | Nó làm gì | | ------------------------------------------ | --------------------------------------------------------------------------------------------------------------- | | ⚡ Gia đình nhanh Grok-4 | mô hình xAI ở mức 0,20 USD/0,50 USD/M — tốc độ chuẩn là 1143 mili giây (nhanh hơn 30% so với Gemini 2.5 Flash) | | 🧠 GLM-5 qua Z.AI | Bối cảnh đầu ra 128K, 0,5 USD/1 triệu USD — sản phẩm chủ lực mới nhất của dòng GLM | | 🔮 MiniMax M2.5 | Lý luận + nhiệm vụ tác nhân ở mức 0,30 USD/1 triệu — nâng cấp đáng kể từ M2.1 | | 🎯 công cụCờ gọi theo mẫu | Mỗi mô hình toolCalling: true/false trong sổ đăng ký — AutoCombo bỏ qua các mô hình không hỗ trợ công cụ | | 🌍 Phát hiện ý định đa ngôn ngữ | Từ khóa PT/ZH/ES/AR trong tính điểm AutoCombo — lựa chọn mô hình tốt hơn cho nội dung không phải tiếng Anh | | 📊 Dự phòng dựa trên điểm chuẩn | Độ trễ p95 thực từ tính điểm kết hợp nguồn cấp dữ liệu yêu cầu trực tiếp — AutoCombo học hỏi từ dữ liệu thực tế | | 🔁 Yêu cầu loại bỏ trùng lặp | Cửa sổ khấu trừ dựa trên hàm băm nội dung — an toàn cho nhiều tác nhân, ngăn chặn các khoản phí trùng lặp | | 🔌 Chiến lược bộ định tuyến có thể cắm | Giao diện RouterStrategy có thể mở rộng — thêm logic định tuyến tùy chỉnh làm plugin |

🚀 Phiên bản trước 2.0.9+ — Sân chơi, Dấu vân tay CLI & ACP

| Tính năng | Nó làm gì | | ----------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 🎮 Model Playground | Trang tổng quan để kiểm tra trực tiếp bất kỳ mô hình nào — bộ chọn nhà cung cấp/mô hình/điểm cuối, Trình chỉnh sửa Monaco, phát trực tuyến, hủy bỏ, tính thời gian | | 🔏 Khớp vân tay CLI