Providers
Deepgram
Deepgram は speech-to-text API です。OpenClaw では、
tools.media.audio を通じた受信音声/ボイスノートの文字起こし、および
plugins.entries.voice-call.config.streaming を通じた Voice Call のストリーミング STT に使用されます。
バッチ文字起こしでは、OpenClaw は完全な音声ファイルを Deepgram にアップロードし、
文字起こし結果を返信パイプラインに注入します({{Transcript}} +
[Audio] block)。Voice Call のストリーミングでは、OpenClaw は live な G.711
u-law frame を Deepgram の WebSocket listen endpoint へ転送し、Deepgram が返す partial または
final transcript を発行します。
| Detail | Value |
|---|---|
| Website | deepgram.com |
| Docs | developers.deepgram.com |
| Auth | DEEPGRAM_API_KEY |
| Default model | nova-3 |
はじめに
API key を設定する
Deepgram API key を環境変数に追加します。
DEEPGRAM_API_KEY=dg_...音声 provider を有効化する
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}ボイスノートを送る
接続済みの任意の channel から音声メッセージを送ってください。OpenClaw は Deepgram 経由でそれを文字起こしし、その transcript を返信パイプラインに注入します。
設定オプション
| Option | Path | Description |
|---|---|---|
model |
tools.media.audio.models[].model |
Deepgram model id(デフォルト: nova-3) |
language |
tools.media.audio.models[].language |
言語ヒント(任意) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
言語検出を有効化(任意) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
句読点付与を有効化(任意) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
スマート整形を有効化(任意) |
言語ヒントあり
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, },}Deepgram オプションあり
{ tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}Voice Call ストリーミング STT
バンドル済みの deepgram Plugin は、Voice Call Plugin 向けの realtime transcription provider も登録します。
| Setting | Config path | Default |
|---|---|---|
| API key | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
DEEPGRAM_API_KEY にフォールバック |
| Model | ...deepgram.model |
nova-3 |
| Language | ...deepgram.language |
(未設定) |
| Encoding | ...deepgram.encoding |
mulaw |
| Sample rate | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| Interim results | ...deepgram.interimResults |
true |
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "deepgram", providers: { deepgram: { apiKey: "${DEEPGRAM_API_KEY}", model: "nova-3", endpointingMs: 800, language: "en-US", }, }, }, }, }, }, },}注意
認証
認証は標準の provider auth 順序に従います。最も簡単なのは DEEPGRAM_API_KEY を使う方法です。
Proxy とカスタム endpoint
proxy を使用する場合は、tools.media.audio.baseUrl と
tools.media.audio.headers で endpoint または header を上書きします。
出力動作
出力は他の provider と同じ音声ルールに従います(size cap、timeout、 transcript injection)。