@botrun/mcp-audio-to-text
v1.6.1
Published
MCP Server for audio/video to text transcription using Google Gemini or NCHC TAIDE Whisper
Readme
MCP Audio to Text
一個用於語音轉文字的 MCP Server,支援 Google Gemini 與 NCHC TAIDE Whisper 作為轉錄 provider。
功能特色
- 支援多種音頻/影片格式:
.mp3,.m4a,.wav,.mp4,.webm,.ogg,.flac等 - 自動處理大檔案分割(超過 20MB 或 3 分鐘)
- 中文自動轉為繁體中文
- 可選擇模型(依 provider 而異;詳見下方 MCP Tool 區塊)
系統需求
- Node.js 18+
- ffmpeg(系統層級安裝)
- Google API Key(使用 Gemini provider 時)或 NCHC TAIDE API Key(使用 NCHC provider 時)
安裝 ffmpeg
# Ubuntu/Debian
sudo apt install ffmpeg
# macOS
brew install ffmpeg
# Windows
# 下載 https://ffmpeg.org/download.html 並加到 PATH使用方式
Claude Desktop 設定
編輯設定檔:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json
使用 Google Gemini(預設):
{
"mcpServers": {
"audio-to-text": {
"command": "npx",
"args": ["-y", "@botrun/mcp-audio-to-text"],
"env": {
"GOOGLE_API_KEY": "your-google-api-key"
}
}
}
}使用 NCHC TAIDE Whisper(需設定 TRANSCRIBER_PROVIDER=nchc):
{
"mcpServers": {
"audio-to-text": {
"command": "npx",
"args": ["-y", "@botrun/mcp-audio-to-text"],
"env": {
"TRANSCRIBER_PROVIDER": "nchc",
"TAIDE_API_KEY": "your-taide-api-key"
}
}
}
}Claude CLI 設定
claude mcp add audio-to-text -e GOOGLE_API_KEY=your-api-key -- npx -y @botrun/mcp-audio-to-textMCP Tool
transcribe_audio
將音頻或影片檔案轉換為文字。
參數依 TRANSCRIBER_PROVIDER 而異:
Gemini 模式(預設)
| 參數 | 類型 | 必填 | 說明 |
|------|------|------|------|
| file_path | string | 是 | 音頻或影片檔案的絕對路徑 |
| output_dir | string | 是 | 輸出目錄路徑 |
| model | string | 否 | flash(較快,預設)或 pro(較準確) |
| custom_model | string | 否 | 自訂 Gemini 模型名稱(僅支援 gemini 開頭,優先於 model) |
NCHC 模式
| 參數 | 類型 | 必填 | 說明 |
|------|------|------|------|
| file_path | string | 是 | 音頻或影片檔案的絕對路徑 |
| output_dir | string | 是 | 輸出目錄路徑 |
| model | string | 否 | whisper-Breeze-ASR-25(預設)或 Whisper-Large-V3 |
環境變數
| 變數 | 說明 | 必要性 |
|------|------|--------|
| TRANSCRIBER_PROVIDER | gemini(預設)或 nchc | 選配 |
| GOOGLE_API_KEY | Google AI API Key | Gemini 模式時必要 |
| TAIDE_API_KEY | 國網中心 TAIDE API Key | NCHC 模式時必要 |
| TAIDE_BASE_URL | NCHC 端點覆寫 | 選配,預設 https://portal.genai.nchc.org.tw/api/v1 |
License
MIT
