Providers

Deepgram

Deepgram is een speech-to-text-API. In OpenClaw wordt deze gebruikt voor inkomende audio-/spraaknotitie-transcriptie via tools.media.audio en voor streaming-STT voor Voice Call via plugins.entries.voice-call.config.streaming.

Voor batchtranscriptie uploadt OpenClaw het volledige audiobestand naar Deepgram en injecteert het transcript in de antwoordpipeline ({{Transcript}} + [Audio]-blok). Voor Voice Call-streaming stuurt OpenClaw live G.711 u-law-frames door via Deepgrams WebSocket-listen-endpoint en geeft gedeeltelijke of definitieve transcripties uit zodra Deepgram ze terugstuurt.

Detail Waarde
Website deepgram.com
Docs developers.deepgram.com
Auth DEEPGRAM_API_KEY
Standaardmodel nova-3

Aan de slag

  • Stel je API-sleutel in

    Voeg je Deepgram-API-sleutel toe aan de omgeving:

    Code
    DEEPGRAM_API_KEY=dg_...
  • Schakel de audioprovider in

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}
  • Stuur een spraaknotitie

    Stuur een audiobericht via een verbonden kanaal. OpenClaw transcribeert het via Deepgram en injecteert het transcript in de antwoordpipeline.

  • Configuratieopties

    Optie Pad Beschrijving
    model tools.media.audio.models[].model Deepgram-model-id (standaard: nova-3)
    language tools.media.audio.models[].language Taalhint (optioneel)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language Taaldetectie inschakelen (optioneel)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate Interpunctie inschakelen (optioneel)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format Slimme opmaak inschakelen (optioneel)

    Met taalhint

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

    Met Deepgram-opties

    json5
    {  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

    Voice Call-streaming-STT

    De gebundelde deepgram-plugin registreert ook een realtime transcriptieprovider voor de Voice Call-plugin.

    Instelling Configuratiepad Standaard
    API-sleutel plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey Valt terug op DEEPGRAM_API_KEY
    Model ...deepgram.model nova-3
    Taal ...deepgram.language (niet ingesteld)
    Codering ...deepgram.encoding mulaw
    Samplefrequentie ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    Tussenresultaten ...deepgram.interimResults true
    json5
    {  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

    Opmerkingen

    Authenticatie

    Authenticatie volgt de standaardvolgorde voor provider-authenticatie. DEEPGRAM_API_KEY is de eenvoudigste route.

    Proxy en aangepaste endpoints

    Overschrijf endpoints of headers met tools.media.audio.baseUrl en tools.media.audio.headers wanneer je een proxy gebruikt.

    Uitvoergedrag

    Uitvoer volgt dezelfde audioregels als andere providers (groottelimieten, time-outs, transcriptinjectie).

    Gerelateerd

    Was this useful?