Providers

Deepgram

Deepgram ist eine Speech-to-Text-API. In OpenClaw wird sie für die Transkription eingehender Audio-/Sprachnachrichten über tools.media.audio und für Streaming-STT in Voice Call über plugins.entries.voice-call.config.streaming verwendet.

Für Batch-Transkription lädt OpenClaw die vollständige Audiodatei zu Deepgram hoch und fügt das Transkript in die Antwortpipeline ein ({{Transcript}} + [Audio]-Block). Für Streaming in Voice Call leitet OpenClaw Live-G.711- u-law-Frames über Deepgrams WebSocket-Endpunkt listen weiter und gibt partielle oder finale Transkripte aus, sobald Deepgram sie zurückliefert.

Detail	Wert
Website	deepgram.com
Dokumentation	developers.deepgram.com
Authentifizierung	`DEEPGRAM_API_KEY`
Standardmodell	`nova-3`

Erste Schritte

API-Schlüssel festlegen

Fügen Sie Ihren Deepgram-API-Schlüssel zur Umgebung hinzu:

Code

DEEPGRAM_API_KEY=dg_...

Audioprovier aktivieren

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

Sprachnachricht senden

Senden Sie eine Audionachricht über einen beliebigen verbundenen Kanal. OpenClaw transkribiert sie über Deepgram und fügt das Transkript in die Antwortpipeline ein.

Konfigurationsoptionen

Option	Pfad	Beschreibung
`model`	`tools.media.audio.models[].model`	Deepgram-Modell-ID (Standard: `nova-3`)
`language`	`tools.media.audio.models[].language`	Sprachhinweis (optional)
`detect_language`	`tools.media.audio.providerOptions.deepgram.detect_language`	Spracherkennung aktivieren (optional)
`punctuate`	`tools.media.audio.providerOptions.deepgram.punctuate`	Zeichensetzung aktivieren (optional)
`smart_format`	`tools.media.audio.providerOptions.deepgram.smart_format`	Intelligente Formatierung aktivieren (optional)

Mit Sprachhinweis

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

Mit Deepgram-Optionen

json5

{  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

Streaming-STT für Voice Call

Das gebündelte deepgram-Plugin registriert auch einen Echtzeit-Transkriptionsprovider für das Voice Call-Plugin.

Einstellung	Konfigurationspfad	Standard
API-Schlüssel	`plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`	Fällt auf `DEEPGRAM_API_KEY` zurück
Modell	`...deepgram.model`	`nova-3`
Sprache	`...deepgram.language`	(nicht gesetzt)
Kodierung	`...deepgram.encoding`	`mulaw`
Abtastrate	`...deepgram.sampleRate`	`8000`
Endpointing	`...deepgram.endpointingMs`	`800`
Zwischenergebnisse	`...deepgram.interimResults`	`true`

json5

{  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

Hinweise

Authentifizierung

Die Authentifizierung folgt der standardmäßigen Auth-Reihenfolge für Provider. DEEPGRAM_API_KEY ist der einfachste Weg.

Proxy und benutzerdefinierte Endpunkte

Überschreiben Sie Endpunkte oder Header mit tools.media.audio.baseUrl und tools.media.audio.headers, wenn Sie einen Proxy verwenden.

Ausgabeverhalten

Die Ausgabe folgt denselben Audioregeln wie bei anderen Providern (Größenlimits, Timeouts, Transkript-Einfügung).

Verwandt

Media-Tools

Überblick über die Audio-, Bild- und Videoverarbeitungspipeline.

Konfiguration

Vollständige Konfigurationsreferenz einschließlich der Einstellungen für Media-Tools.

Fehlerbehebung

Häufige Probleme und Schritte zur Fehlerbehebung.

FAQ

Häufig gestellte Fragen zur Einrichtung von OpenClaw.

Was this useful?