Providers

Deepgram

Deepgram は speech-to-text API です。OpenClaw では、 tools.media.audio を通じた受信音声/ボイスノートの文字起こし、および plugins.entries.voice-call.config.streaming を通じた Voice Call のストリーミング STT に使用されます。

バッチ文字起こしでは、OpenClaw は完全な音声ファイルを Deepgram にアップロードし、文字起こし結果を返信パイプラインに注入します（{{Transcript}} + [Audio] block）。Voice Call のストリーミングでは、OpenClaw は live な G.711 u-law frame を Deepgram の WebSocket listen endpoint へ転送し、Deepgram が返す partial または final transcript を発行します。

Detail	Value
Website	deepgram.com
Docs	developers.deepgram.com
Auth	`DEEPGRAM_API_KEY`
Default model	`nova-3`

はじめに

API key を設定する

Deepgram API key を環境変数に追加します。

Code

DEEPGRAM_API_KEY=dg_...

音声 provider を有効化する

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

ボイスノートを送る

接続済みの任意の channel から音声メッセージを送ってください。OpenClaw は Deepgram 経由でそれを文字起こしし、その transcript を返信パイプラインに注入します。

設定オプション

Option	Path	Description
`model`	`tools.media.audio.models[].model`	Deepgram model id（デフォルト: `nova-3`）
`language`	`tools.media.audio.models[].language`	言語ヒント（任意）
`detect_language`	`tools.media.audio.providerOptions.deepgram.detect_language`	言語検出を有効化（任意）
`punctuate`	`tools.media.audio.providerOptions.deepgram.punctuate`	句読点付与を有効化（任意）
`smart_format`	`tools.media.audio.providerOptions.deepgram.smart_format`	スマート整形を有効化（任意）

言語ヒントあり

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

Deepgram オプションあり

json5

{  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

Voice Call ストリーミング STT

バンドル済みの deepgram Plugin は、Voice Call Plugin 向けの realtime transcription provider も登録します。

Setting	Config path	Default
API key	`plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`	`DEEPGRAM_API_KEY` にフォールバック
Model	`...deepgram.model`	`nova-3`
Language	`...deepgram.language`	（未設定）
Encoding	`...deepgram.encoding`	`mulaw`
Sample rate	`...deepgram.sampleRate`	`8000`
Endpointing	`...deepgram.endpointingMs`	`800`
Interim results	`...deepgram.interimResults`	`true`

json5

{  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

注意

認証

認証は標準の provider auth 順序に従います。最も簡単なのは DEEPGRAM_API_KEY を使う方法です。

Proxy とカスタム endpoint

proxy を使用する場合は、tools.media.audio.baseUrl と tools.media.audio.headers で endpoint または header を上書きします。

出力動作

出力は他の provider と同じ音声ルールに従います（size cap、timeout、 transcript injection）。

Deepgram

はじめに

API key を設定する

音声 provider を有効化する

ボイスノートを送る

設定オプション

言語ヒントあり

Deepgram オプションあり

Voice Call ストリーミング STT

注意

関連

Molty