@gaozh1024/aliyun-speech

v0.1.0

Published

2 months ago

Aliyun real-time speech-to-text package for Expo / React Native with headless hooks and optional UI.

0High
0Medium
0Low

gaozh

aliyun speech asr react-native expo voice-to-text

@gaozh1024/aliyun-speech

Expo / React Native 阿里云实时语音转文字能力包

提供三层能力：

core 协议层：AliyunSpeechTranscriber
headless hook：useAliyunVoiceToText
可选默认 UI：VoiceToTextInput

适合在聊天输入框、语音速记、语音命令输入等场景复用。

📦 安装

pnpm add @gaozh1024/aliyun-speech
pnpm add @siteed/audio-studio expo-audio

或：

npm install @gaozh1024/aliyun-speech @siteed/audio-studio expo-audio

前置依赖与配置

本包默认录音实现基于：

@siteed/audio-studio
expo-audio

Expo app.json 插件配置

{
  "expo": {
    "plugins": [
      [
        "@siteed/audio-studio",
        {
          "enableNotifications": false,
          "enableBackgroundAudio": false,
          "enablePhoneStateHandling": false,
          "enableDeviceDetection": false,
          "iosConfig": {
            "microphoneUsageDescription": "需要麦克风权限用于语音转文字"
          }
        }
      ]
    ],
    "ios": {
      "infoPlist": {
        "NSMicrophoneUsageDescription": "需要麦克风权限用于语音转文字"
      }
    },
    "android": {
      "permissions": ["RECORD_AUDIO"]
    }
  }
}

如果你的 App 已经配置过麦克风权限和 @siteed/audio-studio 插件，可直接复用。

✨ 设计目标

headless 优先：业务状态机和协议层不依赖具体 UI
UI 可选：内置一个默认语音输入组件，但不是强制入口
token 外部提供：支持手动设置、按需刷新、自动刷新
录音器可替换：默认适配 @siteed/audio-studio
权限实现可替换：默认使用 expo-audio，也支持外部注入

🚀 初始化

import { initializeAliyunSpeech } from '@gaozh1024/aliyun-speech';

initializeAliyunSpeech({
  appKey: 'your-app-key',
  url: 'wss://nls-gateway-cn-beijing.aliyuncs.com/ws/v1',
  format: 'pcm',
  sampleRate: 16000,
  intervalMs: 100,
  tokenRefreshBufferMs: 60_000,
  refreshToken: async () => {
    return {
      token: await fetchAliyunTokenFromServer(),
      ttlMs: 30 * 60 * 1000,
    };
  },
});

🔐 token 管理

主动设置 token

import { setAliyunSpeechToken } from '@gaozh1024/aliyun-speech';

setAliyunSpeechToken(token, {
  ttlMs: 30 * 60 * 1000,
});

即将连接前自动刷新

import { refreshAliyunSpeechTokenIfNeeded } from '@gaozh1024/aliyun-speech';

await refreshAliyunSpeechTokenIfNeeded();

强制刷新

import { refreshAliyunSpeechToken } from '@gaozh1024/aliyun-speech';

await refreshAliyunSpeechToken();

🪝 推荐接入方式

1. headless hook

import { useAliyunVoiceToText } from '@gaozh1024/aliyun-speech';

const voice = useAliyunVoiceToText({
  onSendText,
  onEditText,
  onError: showError,
});

2. 默认 UI

import { VoiceToTextInput } from '@gaozh1024/aliyun-speech';

<VoiceToTextInput
  onSendText={onSendText}
  onEditText={onEditText}
  texts={{ idle: '按住说话' }}
  theme={{ triggerIdleBackground: '#111827' }}
/>;

📚 导出能力

配置与 token

initializeAliyunSpeech
setAliyunSpeechToken
clearAliyunSpeechToken
getAliyunSpeechConfig
getAliyunSpeechToken
getAliyunSpeechTokenState
refreshAliyunSpeechToken
refreshAliyunSpeechTokenIfNeeded
resolveAliyunSpeechConfig

协议层 / hook / 组件

AliyunSpeechTranscriber
useAliyunVoiceToText
VoiceToTextInput
useAudioStudioRecorder
ensureMicrophonePermission

🧩 自定义能力边界

如果你不想使用默认实现，可以自行注入：

recorder
ensurePermission
speechConfig

这样可以保留协议层和编排层，同时替换录音器或权限来源。

⚠️ 注意事项

不要在包内写死明文 token / appKey
生产环境 token 应由服务端签发
建议在进入语音页面前先调用 refreshAliyunSpeechTokenIfNeeded()
当前默认录音实现依赖 Expo 生态，更适合 Expo / prebuild 项目

🛠️ 本地开发

pnpm --filter @gaozh1024/aliyun-speech typecheck
pnpm --filter @gaozh1024/aliyun-speech build

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme

@gaozh1024/aliyun-speech

📦 安装

前置依赖与配置

Expo app.json 插件配置

✨ 设计目标

🚀 初始化

🔐 token 管理

主动设置 token

即将连接前自动刷新

强制刷新

🪝 推荐接入方式

1. headless hook

2. 默认 UI

📚 导出能力

配置与 token

协议层 / hook / 组件

🧩 自定义能力边界

⚠️ 注意事项

🛠️ 本地开发