claud-prism-aireview
v0.14.5
Published
Multi-AI provider toolkit for Claude Code — cross-provider code review, research, and UI design via Codex + Gemini
Maintainers
Readme
claude-prism
Claude Code 的跨 Provider AI 調度工具 — 消除同源盲點。
核心概念
問題
AI code review 很吵。市場上最好的工具 F1 score 大概也才 64%——有相當比例的發現不是假警報就是漏網之魚。多數工具的解法是讓 AI 自己評估信心度(「我 90% 確定這是 bug」),但這就是自己改自己的考卷。
還有一個更深層的結構性問題:當 Claude Code 寫你的程式碼同時也 review 它時,你會得到同源盲點。同一個模型有相同的知識缺口,某些類型的 bug、設計缺陷和安全問題會持續漏掉。就算開四個 Claude agent 來 review 也一樣,因為底層訓練資料和偏好都相同。更多 agent ≠ 更多觀點。
解法
1. 跨 Provider 三角驗證:Claude 負責調度,review 任務分派給 Gemini 和 Codex。三個 provider、三組訓練資料、三組互相抵消的盲點。
2. 證據導向信心度評分:不問 AI「你有多確定」,而是用可驗證的證據算分:具體行號(+25)、規則引用(+20)、可重現場景(+15)、幻覺引用(-50)。核心公式是 deterministic——同樣的證據永遠得到同樣的分數。公開 spec,沒有黑盒。
3. Local-first:程式碼直接送到各家 provider 的 API,中間沒有任何中繼伺服器、沒有第三方經手你的 code。
為什麼選 claude-prism?
| | claude-prism | 單一 Provider 多 Agent 審查 | |---|---|---| | Provider 多樣性 | Codex + Gemini + Claude(3 個獨立模型) | 多個 agent,同一底層模型 | | 盲點覆蓋 | 跨訓練資料:每個模型抓到其他模型漏掉的 | 同一訓練資料偏差在 agent 間放大 | | 成本 | 近乎零(Codex CLI + Gemini CLI 免費額度) | 每 PR $15–25(官方工具,Team/Enterprise 方案) | | 速度 | 1–2 分鐘 | ~20 分鐘 | | 可用性 | 任何有 CLI 的人 | 僅限付費團隊方案 | | 評分方式 | 證據導向公式(公開 spec),deterministic 核心,同樣證據 = 同樣分數 | LLM 自評,AI 給自己打信心分數 | | 資料路徑 | Local-first:直連 provider API,無中繼伺服器 | 依服務而異 |
與 /ultrareview 的比較(2026-04-16 發布)
Anthropic 在 2026-04-16 隨 Claude Opus 4.7 一起推出 /ultrareview——雲端 review,在遠端 sandbox 啟動一整批 Claude agent,每個發現都獨立驗證。相較單次 /review 是實質升級,但和 claude-prism 打的是不同的戰場:
| | claude-prism /pi-multi-review | /ultrareview |
|---|---|---|
| 模型多樣性 | Codex + Gemini + Claude(3 個獨立模型) | 多個 Claude agent,同一底層模型 |
| 盲點策略 | 異質訓練資料抵消共同盲區 | 同源——多跑幾次,盲區一樣 |
| 審查立場 | 對抗式,攻擊面分工 | 驗證導向(降低誤報率) |
| 免費額度 | 無上限(用現有 CLI 訂閱) | 每帳號終身 3 次,用完不補 |
| Team / Enterprise 免費次數 | 無上限 | 0 |
| 超過免費額度後 | 仍然無上限 | 每次約 $5–$20,計入 extra usage |
| 僅用 API key 的 Claude Code | 可用 | 被擋(必須 Claude.ai 登入) |
| Bedrock / Vertex / Foundry | 可用(provider-agnostic) | 不支援 |
| Zero Data Retention 組織 | 可用 | 被擋 |
| CI/CD | ci-review.sh 跑在 GitHub Actions | 僅限互動 session |
兩個工具優化的場景不同。/ultrareview 適合 Pro/Max 用戶在 Claude 生態內做 pre-merge 信心確認。/pi-multi-review 則是為那個圈子外的一切而生——CI pipeline、受法規/ZDR 管制的環境、沒有 Pro/Max 授權的團隊,以及任何想要「不共享 Claude 訓練資料的第三方觀點」的人。
為什麼信任這些發現?
多數 AI review 工具都用類似做法:讓 AI 對自己的發現打 0–100 信心分數,低於門檻就過濾。Anthropic 官方 code review plugin 也使用 ≥80 門檻。問題是 LLM 產生的信心分數不穩定——同一份 review 跑兩次可能得到不同分數。
claude-prism 的 Confidence Scoring Framework 做法不同:用可驗證的證據打分,不靠 AI 自我評估。comment 有指出具體行號?+25。有引用 OWASP 規則?+20。提到一個不存在的檔案?-50。公式是 deterministic、model-agnostic 的,你可以打開 spec 驗證每一分怎麼來的。
快速開始
前置需求
| 工具 | 必要性 | 安裝方式 |
|------|--------|----------|
| Claude Code | 必要 | npm install -g @anthropic-ai/claude-code |
| Gemini CLI | Gemini 相關指令需要 | npm install -g @google/gemini-cli |
| Codex CLI | Codex 相關指令需要 | npm install -g @openai/codex |
⚠️ Gemini CLI 服務更新(2026-03-25 生效)
Google 正在調整 Gemini CLI 的流量路由方式。免費帳號將僅限 Flash 模型(不再支援 Pro),所有用戶在尖峰時段可能遇到限流。如果遇到 timeout:
# 方案一:使用 Flash(更快,coding benchmark 分數比 Pro 更高) export GEMINI_MODEL="gemini-3-flash-preview" # 方案二:使用自己的 API key 取得獨立 quota export GEMINI_API_KEY="your-key-from-ai-studio"詳見環境變數。
安裝
快速安裝(推薦)
npx claud-prism-aireview一行完成下載與安裝——自動將 commands 部署到 ~/.claude/commands/、scripts 到 ~/.claude/scripts/。不使用 postinstall scripts,由你明確執行此指令。
npm 全域安裝
npm install -g claud-prism-aireview
claud-prism-aireview # ← 必要步驟:將 commands 和 scripts 部署到 ~/.claude/注意:
npm install -g只會將執行檔放入 PATH,不會自動部署指令檔案。你必須手動執行一次claud-prism-aireview才能完成安裝。這是刻意的設計——我們不使用postinstallscripts 以確保供應鏈安全。
Homebrew (macOS)
brew tap tznthou/claude-prism
brew install claud-prism-aireview手動安裝
git clone https://github.com/tznthou/claude-prism.git
cd claude-prism
./install.sh安裝程式會檢查前置需求、透過 SHA256 checksum 驗證檔案完整性、覆寫前自動備份、然後將 commands 複製到 ~/.claude/commands/、scripts 到 ~/.claude/scripts/。
驗證安裝
./tests/smoke-test.sh移除
npx claud-prism-aireview --uninstall
# 或手動:
./uninstall.sh指令一覽
| 指令 | Provider | 說明 |
|------|----------|------|
| /pi-ask-codex | Codex | 直接提問 — 取得 OpenAI 觀點 |
| /pi-ask-gemini | Gemini | 直接提問 — 取得 Google 觀點 |
| /pi-askall | Codex + Gemini + Claude | 同時詢問所有 provider — 三方觀點 + 綜合分析 |
| /pi-code-review | Codex | 對抗式程式碼審查 — 打破信心而非驗證(含信心度評分) |
| /pi-fact-check | Gemini + WebSearch + Claude | 事實查核 — 雙軌搜尋(Gemini + WebSearch 同步),Claude 以收斂度評分驗證 |
| /pi-ui-design | Gemini | 從設計規格產生 HTML mockup |
| /pi-ui-review | Gemini | UI/UX 無障礙與設計審查(含信心度評分) |
| /pi-research | Gemini + WebSearch + Claude | 結構化技術研究 — 雙軌搜尋(Gemini + WebSearch 同步) |
| /pi-multi-review | Codex + Gemini + Claude | 三方對抗式審查 — 分工攻擊面(智慧路由 + 信心度評分) |
| /pi-plan | Codex + Gemini + Claude | 多方觀點實作規劃,適用於架構決策 |
所有指令皆內建 graceful degradation — 若某個 provider 不可用,Claude 會用剩餘的 provider 繼續執行,而非直接失敗。每次失敗都附帶結構化錯誤診斷(TIMEOUT、RATE_LIMIT、AUTH_ERROR、PERMISSION、SANDBOX、NETWORK、CLI_ERROR 或 CLI_NOT_FOUND)並建議替代指令。
/pi-ask-codex — 詢問 OpenAI
直接向 Codex 提問,取得 OpenAI 的觀點。
/pi-ask-codex React Query v5 中處理 optimistic updates 的最佳做法?/pi-ask-gemini — 詢問 Google
直接向 Gemini 提問,利用 Google 的生態廣度。
/pi-ask-gemini 比較 Bun vs Deno vs Node.js 作為 2026 年新後端專案的選擇/pi-askall — 詢問所有 Provider
同時向 Codex 和 Gemini 發送相同問題,Claude 綜合三方觀點。適用於任何議題——不限於程式碼。每個 provider 獨立回應(無交叉污染),Claude 比較共識、標記分歧、給出整合結論。
/pi-askall 新的微服務該用 monorepo 還是 polyrepo?
/pi-askall 協作編輯器的即時同步最佳方案?/pi-fact-check — 跨 Provider 事實查核
雙軌搜尋:Gemini(search grounding)與 WebSearch 同步執行,消除等待時間。Claude 獨立交叉驗證、URL 存在性檢查、以來源收斂度評分信心(多少獨立來源一致)。包含來源層級排名(L1 官方紀錄到 L6 社群)、同源報導去重、對抗性證據檢查。
/pi-fact-check article.md
/pi-fact-check https://example.com/blog-post
/pi-fact-check "特斯拉 2024 年交付 180 萬輛,市場佔有率超過 50%"/pi-code-review — 對抗式 Code Review
Codex 以對抗式立場 review Claude 寫的程式碼——reviewer 的任務是打破你對這份改動的信心,而非驗證它。核心用例依然是不同 AI 寫、不同 AI 審,但 prompt 從中性的 "Senior Reviewer" 升級為 adversarial stance,定義了 9 類攻擊面(auth、data loss、race condition、rollback safety 等),每個 finding 必須回答四個問題:會出什麼問題、為什麼脆弱、影響多大、怎麼修。
每個 issue 都會使用 Confidence Scoring Framework 打 0–100 分——evidence-based、deterministic 的雜訊過濾。只有 ≥ 80 分的 issue 會顯示。Review 同時檢查 inline annotation 合規性(IMPORTANT/WARNING/TODO 註解),--pr 模式下還會查詢同檔案的歷史 PR 評論,浮現反覆出現的問題。
/pi-code-review # review staged changes
/pi-code-review src/auth.ts # review 指定檔案
/pi-code-review --diff # review unstaged changes
/pi-code-review --pr # review 整個 PR/pi-ui-design — 從設計規格產生 HTML Mockup
Gemini 讀取設計規格文件,產出可在瀏覽器預覽的自包含 HTML mockup(Tailwind CDN)。確認設計後再讓 Claude Code 實作到專案。
/pi-ui-design design-spec.md # 從設計規格產生 HTML mockup
/pi-ui-design "一個 SaaS dashboard" # 沒有設計檔 → Gemini 先產規格再產 mockup/pi-ui-review — UI/UX 審查
Gemini 審查前端程式碼的無障礙、響應式設計、元件結構和 UX 模式。Issue 使用 UI 專用信心度評分(WCAG 引用、使用者影響描述)。若專案有 CLAUDE.md 或 Agents.md,會自動檢查規範合規性。
/pi-ui-review src/components/Header.tsx
/pi-ui-review src/app/(public)/
/pi-ui-review --screenshot ./screenshot.png # 改用 Claude 視覺分析/pi-research — 技術研究
雙軌搜尋:Gemini(search grounding)和 WebSearch 同步執行,產出結構化技術研究報告,含比較表、推薦方案和來源 URL。任一軌道失敗時另一軌道自動補位——與 /pi-fact-check 相同的韌性架構。若研究主題與當前專案相關,會自動帶入相關 context(依賴、既有模式)。研究結果可選擇存到 .claude/pi-research/ 供日後參考。
/pi-research Next.js App Router 最佳認證方案
/pi-research Monorepo 工具比較:Turborepo vs Nx vs Moon/pi-multi-review — 三方對抗式 Review(分工攻擊面)
旗艦指令。同一份程式碼同時送給 Codex 和 Gemini 進行分工 adversarial review——Codex 攻擊 security 與 data integrity(auth、data loss、race condition、schema drift 等 7 類),Gemini 攻擊 design、UX 與 maintainability(edge case UX、accessibility、abstraction leak、test coverage 等 7 類)。Claude 整合分析:
- 共識區 — 雙方都指出的問題(高信心度,優先修復)
- 分歧區 — 只有一方發現的問題(Claude 判斷有效性)
- 規範合規 — 違反
CLAUDE.md/Agents.md專案規則的問題 - Claude 補充 — 雙方都沒抓到但值得注意的問題
信心度評分(spec):所有 provider 的每個 issue 都會被打 0–100 分,基於證據品質而非 Claude 的觀點。只有 ≥ 80 分的 issue 會進入最終輸出。Base score 40,正面因子:具體行號(+25)、本次 diff 引入的程式碼(+25)、引用規則(+20)、可重現場景(+15)、多方共識(+20)。雜訊因子:主觀風格偏好(-25)、linter 可偵測(-25)、幻覺引用(-50)。此 framework 是 deterministic、model-agnostic 的獨立標準。
智慧路由(v0.7.0):自動從檔案副檔名和路徑偵測改動的 domain(frontend/backend/fullstack)。合成時,domain 權威的 provider 享有更高權重——前端由 Gemini 主導(UI/UX 專長),後端由 Codex 主導(安全/演算法專長)。兩方 provider 都會被呼叫,權重只影響 Claude 如何處理分歧。
/pi-multi-review # review staged changes
/pi-multi-review --pr # review 整個 PR/pi-plan — 多方觀點實作規劃
適用於有多條可行路徑的任務——架構決策、技術選型、遷移策略。諮詢 Codex 和 Gemini 取得獨立架構分析,Claude 綜合成結構化計畫檔。
計畫存到 .claude/pi-plans/,包含:背景、多方分析、逐步實作步驟、關鍵檔案、風險和驗證標準。計畫檔跨 session 持久化。
適合複雜決策;簡單的任務拆解請直接用 Claude Code 內建的 plan mode。
/pi-plan 從 REST 遷移到 GraphQL — 評估 Apollo vs Relay vs urql
/pi-plan 重構支付模組以支援多個支付商系統架構
flowchart LR
User["👤 使用者"] <--> Claude["🟣 Claude Code\n(調度者)"]
Claude -->|"/pi-ask-codex\n/pi-askall\n/pi-code-review\n/pi-multi-review\n/pi-plan"| Codex["🟢 Codex CLI"]
Claude -->|"/pi-ask-gemini\n/pi-askall\n/pi-fact-check\n/pi-ui-design\n/pi-ui-review\n/pi-research\n/pi-multi-review\n/pi-plan"| Gemini["🔵 Gemini CLI"]
CI["⚙️ GitHub Actions"] -->|"ci-review.sh"| GeminiAPI["🔵 Gemini API"]
CI -->|"ci-review.sh"| OpenAIAPI["🟢 OpenAI API"]
CI -->|"synthesis"| ClaudeAPI["🟣 Claude API"]運作原理
- 使用者在 Claude Code 輸入 slash command(如
/pi-code-review src/auth.ts) - Claude Code 讀取 command 定義(含指示的 Markdown)
- Claude 讀取相關程式碼,組裝 prompt
- 若指令需要同時呼叫兩個以上 provider,Claude 透過 sub-agent fan-out 分派(詳見下方實證基礎)
- 各 sub-agent 透過 Bash tool 呼叫 shell script → script 調用外部 CLI
- 外部 AI 並行處理請求並回傳結果
- Claude 呈現綜合結果,適時加入自己的觀點
- Review 指令完成後,Claude 會解讀各 provider 的輸出(嚴重度、分類、來源),把結構化結果寫入
review-insights.jsonl供日後趨勢分析
實證基礎
多數 AI 調度工具都宣稱「我們並行呼叫多個 provider」。我們用跨三層執行 context 的對照實驗驗證了這個宣稱在 Claude Code 裡是否真的成立——結果發現:除非你為並行而設計,否則它不會自然發生。
問題
當 Claude Code 在同一 message 裡發兩個 Bash tool call(call-codex.sh + call-gemini.sh),它們真的同時跑嗎?還是某一層其實有 queue?
對照實驗(N=36+)
五個實驗組對應三個候選假說(queue / provider contention / capacity):
| 組 | 設定 | 驗證層級 |
|---|---|---|
| A | 主對話、同 message、2 個 Bash(Codex + Gemini) | 主對話層 queue |
| B | 主對話 → 2 個 sub-agent,各跑 1 個 CLI | sub-agent 層 queue |
| B-hold15 / B-sleep / B-swap | 變量隔離 | 拆掉 CLI / provider / 順序干擾 |
| F | 2 個 sub-agent,都跑 Gemini | 排除 provider 異質性 |
| D | 純 OS shell & fork | Claude Code 之下的 baseline |
結果 — 分層行為(MECE)
| 層級 | Queue 序列化 | Silence watchdog | Sleep guard | Auto-background |
|---|---|---|---|---|
| OS shell & fork | ❌ | ❌ | ❌ | ❌ |
| Sub-agent Bash | ❌(真並行) | ❓ 未測 | ✅ | 🔥 偶發 |
| 主對話 Bash | ✅(同 message 內 FIFO) | ❌ | ❌ | ❌ |
- A 層:N=7,
delta/first_exec= 1.00 跨兩個 capacity window,每一次都精準吻合。 最極端的一次:Codex 跑 150 秒,Gemini 的 invoke 時間戳跟 Codex 結束時間戳精確到秒地重合。零 variance。 - B 層:N=13,dispatch delta 中位數 2.8 秒。 B-hold15 證實 Gemini 在 Codex 還在
sleep 15時就正常 dispatch;B-sleep 證實 Codex 側完全沒跑 CLI,Gemini 照樣並行。 - OS 層:N=6,delta ≈ 0 秒。 Claude Code 之下沒有任何限制。
對比圖 — 同樣的工作、不同的佈局
sequenceDiagram
participant M as 主對話
participant S1 as Sub-agent 1
participant S2 as Sub-agent 2
Note over M: 反模式(structural FIFO)
M->>M: Bash: call-codex.sh(10s)
M->>M: Bash: call-gemini.sh(排隊中)
Note over M: 總計:20s
Note over M,S2: 正確模式(sub-agent fan-out)
M->>S1: Agent(codex 側)
M->>S2: Agent(gemini 側)
par
S1->>S1: Bash: call-codex.sh(10s)
and
S2->>S2: Bash: call-gemini.sh(10s)
end
Note over M,S2: 總計:~13s(10s exec + 2.8s dispatch)這為什麼重要
pi-askall、pi-plan、pi-multi-review、pi-fact-check——凡是會呼叫兩個以上 provider 的指令,都走 sub-agent fan-out,不在主對話直接發並行 Bash。這不是架構偏好,是唯一能在 Claude Code 的 structural FIFO 下拿到真並行的執行層。
完整摘要、分層資料、產品決策 trace:docs/research/bash-tool-parallelism.md(英文)。
技術棧
| 技術 | 用途 | 備註 | |------|------|------| | Bash | CLI 包裝腳本 | 負責 binary 偵測、logging、stdin 管線 | | Markdown | Slash command 定義 | Claude Code 讀取這些檔案作為指令 | | Claude Code | 調度者 | 讀取 command,透過 sub-agent fan-out 分派 | | Codex CLI | OpenAI 存取 | Code review 與 Q&A(模型可設定) | | Gemini CLI | Google 存取 | 研究、UI 審查、Q&A(模型可設定) | | GitHub Actions | CI/CD 整合 | 自動化 PR review,透過 REST API |
專案結構
claude-prism/
├── .github/workflows/
│ ├── ai-review.yml # GitHub Actions CI review workflow
│ └── shellcheck.yml # ShellCheck 靜態分析
├── docs/ # 深度文件(見下方延伸閱讀)
├── spec/ # 獨立規格文件
│ └── confidence-scoring-v1.md # Evidence-based 雜訊過濾 framework
├── commands/ # Slash command 定義(Markdown)
├── scripts/ # CLI 包裝腳本與工具(Bash)
│ ├── call-codex.sh # Codex CLI 包裝(含 soft-timeout)
│ ├── call-gemini.sh # Gemini CLI 包裝(含 soft-timeout)
│ ├── detect-domain.sh # 智慧路由 domain 偵測
│ ├── analyze-log.sh # 呼叫生命週期診斷
│ ├── ci-review.sh # CI/CD review 調度器(curl API)
│ ├── usage-summary.sh # API 使用量統計
│ └── review-insights.sh # Review 趨勢分析
├── tests/smoke-test.sh
├── checksums.sha256 # SHA256 checksum 完整性驗證
├── install.sh / uninstall.sh
├── README.md / README.zh-TW.md
└── CHANGELOG.md安裝後的位置:
~/.claude/
├── commands/ # ← command 定義複製到此
├── scripts/ # ← 包裝腳本複製到此
└── logs/
├── multi-ai.log # 呼叫紀錄(時間戳、prompt/response 長度)
└── review-insights.jsonl # 結構化 review 歷史(自動記錄)設定
環境變數
| 變數 | 預設值 | 說明 |
|------|--------|------|
| GEMINI_MODEL | (CLI 預設) | 覆蓋 Gemini 模型(如 gemini-3-flash-preview) |
| GEMINI_MODEL_DEEP | (回退至 GEMINI_MODEL,再回退至 CLI 預設) | 重推理指令用的模型(/pi-fact-check、/pi-research、/pi-multi-review、/pi-plan) |
| CODEX_MODEL | (CLI 預設) | 覆蓋 Codex 模型(如 gpt-5.3-codex) |
| GEMINI_API_KEY | (無) | 使用自己的 AI Studio API key 取代 OAuth(申請) |
| GEMINI_BIN | (自動偵測) | Gemini 執行檔路徑 |
| CODEX_BIN | (自動偵測) | Codex 執行檔路徑 |
| MULTI_AI_LOG_DIR | ~/.claude/logs | 紀錄檔目錄 |
| CLAUDE_PRISM_TIMEOUT(v0.14.0+) | 110 | Soft-timeout 掛鐘時限(整數秒,範圍 1..3600)。無效值自動 fallback 到 110 並寫入 WARN log。超時時 wrapper 會發出 rc=124 + stderr sentinel + soft_timeout log event,取代原本被 Claude Code harness 在 130 秒附近悄悄 SIGKILL 的黑洞。已知會跑比較久的任務可以 per-invocation 調寬:CLAUDE_PRISM_TIMEOUT=180 ./call-codex.sh "40KB review prompt" |
預設不指定模型,由各 CLI 使用內建預設值——零設定即可用。如需指定模型:
# Shell 設定檔(~/.zshrc 或 ~/.bashrc)
export GEMINI_MODEL="gemini-3-flash-preview"
export GEMINI_MODEL_DEEP="gemini-3-pro-preview"
export CODEX_MODEL="gpt-5.3-codex"
# 選用:使用自己的 API key 取得獨立 quota
export GEMINI_API_KEY="your-key-from-ai-studio"
# 或單次呼叫時用 -m flag
~/.claude/scripts/call-gemini.sh -m gemini-3-flash-preview "your prompt"Script 功能
兩個包裝腳本都支援:
| 功能 | 說明 |
|------|------|
| Streaming 輸出 | CLI 回應透過 tee 即時串流到 stdout,不做 buffering |
| SIGHUP 防禦 | Script 忽略 SIGHUP,背景化時不會被終止 |
| 背景化 Fallback | 每次呼叫的輸出各自寫到 mktemp 檔(v0.14.2+,byte-sync)。Sub-agent fan-out skills(pi-askall / pi-plan / pi-multi-review)傳 $CLAUDE_PRISM_OUT_TMP 取得 caller-owned 隔離 OUT_TMP(v0.14.3+,解 cross-session race);direct skills 仍讀 shared pi-{codex,gemini}-last.out symlink 做 empty-stdout fallback(legacy best-effort) |
| Binary 偵測 | 自動搜尋多個路徑找 CLI 執行檔 |
| Logging | 每次呼叫記錄到 ~/.claude/logs/multi-ai.log(含時間戳) |
| --dry-run | 測試模式,不呼叫 API(不消耗 token) |
| Stdin 管線 | echo "code" \| call-gemini.sh "prompt" 處理長輸入 |
| Model 切換 | -m model-name 指定不同模型 |
| Soft-timeout(v0.14.0+) | Provider CLI 呼叫被 CLAUDE_PRISM_TIMEOUT 掛鐘限制(預設 110 秒,範圍 1..3600)。超時時結構化退出:rc=124、stderr sentinel、soft_timeout log event 讓 analyze-log.sh 歸類為 SOFT_TIMEOUT——比 Claude Code ~130 秒的 harness watchdog 更早觸發 |
自訂
新增 Provider: 建立 scripts/call-newprovider.sh 和 commands/ask-newprovider.md(參考現有格式),執行 ./install.sh 部署。
修改 Review Prompt: 編輯 commands/ 下的 .md 檔案,prompt 模板內嵌其中。
延伸閱讀
所有「安裝與使用」之外的細節都放在 docs/:
| 主題 | English | 繁體中文 |
|---|---|---|
| 可觀測性 — 使用量統計、review 趨勢、呼叫生命週期、快取 TTL | docs/observability.md | docs/observability.zh-TW.md |
| CI/CD 整合 — GitHub Actions workflow、CI 環境變數、安全注意事項 | docs/ci-cd.md | docs/ci-cd.zh-TW.md |
| 成本估算 — 各指令 token 範圍、成本控制工具 | docs/cost.md | docs/cost.zh-TW.md |
| 供應鏈安全 — 免 postinstall 設計、防禦層級、自行驗證 | docs/supply-chain-security.md | docs/supply-chain-security.zh-TW.md |
| 隱私與資料流向 — 送出什麼、留在本地什麼、Provider 條款 | docs/privacy.md | docs/privacy.zh-TW.md |
| 隨想 — 設計筆記與心得 | docs/reflections.md | docs/reflections.zh-TW.md |
| 研究 — sub-agent fan-out 設計背後的 Bash tool 分層研究 | docs/research/bash-tool-parallelism.md | — |
| Confidence Scoring Framework | normative spec | — |
| CHANGELOG | 版本歷史 | — |
FAQ
Q: Claude 真的有呼叫外部 CLI 嗎?還是自編自導?
Logging 預設開啟,檢查 ~/.claude/logs/multi-ai.log 即可驗證。每次呼叫都有時間戳、模型名稱和 prompt/response 長度。
Q: 如果我只裝了 Gemini CLI?
沒問題。所有指令都內建 graceful degradation 和結構化錯誤診斷——若 provider 不可用,失敗訊息會包含具體原因(TIMEOUT、RATE_LIMIT、AUTH_ERROR、PERMISSION、SANDBOX、NETWORK、CLI_ERROR 或 CLI_NOT_FOUND)並建議替代指令。/pi-multi-review 和 /pi-askall 會使用 Claude + 可用的 provider(兩方觀點取代三方)。/pi-code-review 會退回 Claude 獨立審查並加註同源盲點警告,同時建議改用 /pi-multi-review。/pi-fact-check 和 /pi-research 都採用雙軌搜尋(Gemini + WebSearch 同步);若兩者皆失敗才退至 Claude 訓練資料。
Q: 如果 provider 回傳格式不符預期?
Claude 會處理。若 Codex 或 Gemini 沒有按照要求的 emoji/score 格式回覆,Claude 會用語意比對從原始文字中提取可行動的問題。分數欄位在未提供時顯示「—」。
Q: 費用多少?
參閱 docs/cost.zh-TW.md 了解各指令的 token 消耗範圍和成本控制工具。
Q: Gemini CLI 一直 timeout 或回應很慢?
很可能是 Pro 模型限流。兩種解法:(1) 設定 GEMINI_MODEL="gemini-3-flash-preview",Flash 更快,coding benchmark 分數也更高(SWE-bench:Flash 78% vs Pro 76.2%)。(2) 設定 GEMINI_API_KEY,用自己的 AI Studio key 取得獨立 quota。詳見 Gemini CLI 服務更新。
Q: 可以搭配其他 Claude Code 設定使用嗎?
可以。Commands 和 scripts 是獨立的,只依賴 Claude Code 的 ~/.claude/ 目錄慣例。
Q: 隱私政策 / 供應鏈安全細節在哪?
docs/privacy.zh-TW.md 與 docs/supply-chain-security.zh-TW.md。
貢獻指南
歡迎貢獻!不論是 bug 修復、新 provider 整合、prompt 改善,還是文件修正——請參閱我們的貢獻指南開始。
本專案遵循 Contributor Covenant 行為準則,參與即代表你同意遵守。
快速連結:
致謝
/pi-fact-check 一開始有參考 newtype-os 的 super-fact-checker 方法論(作者是我很喜歡的 YouTuber)。後來覺得直接搬別人的框架不太對,就整個砍掉重寫了,加入跨 provider 驗證、對抗性證據這些我們自己的東西。但起點的功勞還是值得大書特書的。
授權
本專案採用 MIT 授權。
作者
tznthou — tznthou.com · [email protected]
