--- read_when: - Vuoi speech-to-text di Deepgram per allegati audio - Vuoi la trascrizione in streaming di Deepgram per Voice Call - Hai bisogno di un rapido esempio di configurazione Deepgram summary: Trascrizione Deepgram per le note vocali in ingresso title: Deepgram x-i18n: generated_at: "2026-04-25T13:55:18Z" model: gpt-5.4 provider: openai source_hash: 9d591aa24a5477fd9fe69b7a0dc44b204d28ea0c2f89e6dfef66f9ceb76da34d source_path: providers/deepgram.md workflow: 15 --- Deepgram è un'API di speech-to-text. In OpenClaw viene usata per la trascrizione in ingresso di audio/note vocali tramite `tools.media.audio` e per la STT in streaming di Voice Call tramite `plugins.entries.voice-call.config.streaming`. Per la trascrizione batch, OpenClaw carica il file audio completo su Deepgram e inietta la trascrizione nella pipeline di risposta (`{{Transcript}}` + blocco `[Audio]`). Per la trascrizione in streaming di Voice Call, OpenClaw inoltra frame live G.711 u-law tramite l'endpoint WebSocket `listen` di Deepgram ed emette trascrizioni parziali o finali man mano che Deepgram le restituisce. | Dettaglio | Valore | | -------------- | ---------------------------------------------------------- | | Sito web | [deepgram.com](https://deepgram.com) | | Documentazione | [developers.deepgram.com](https://developers.deepgram.com) | | Autenticazione | `DEEPGRAM_API_KEY` | | Modello predefinito | `nova-3` | ## Per iniziare Aggiungi la tua chiave API Deepgram all'ambiente: ``` DEEPGRAM_API_KEY=dg_... ``` ```json5 { tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3" }], }, }, }, } ``` Invia un messaggio audio tramite qualsiasi canale collegato. OpenClaw lo trascrive tramite Deepgram e inietta la trascrizione nella pipeline di risposta. ## Opzioni di configurazione | Opzione | Percorso | Descrizione | | ---------------- | ------------------------------------------------------------ | ------------------------------------- | | `model` | `tools.media.audio.models[].model` | Id modello Deepgram (predefinito: `nova-3`) | | `language` | `tools.media.audio.models[].language` | Suggerimento lingua (facoltativo) | | `detect_language` | `tools.media.audio.providerOptions.deepgram.detect_language` | Abilita il rilevamento della lingua (facoltativo) | | `punctuate` | `tools.media.audio.providerOptions.deepgram.punctuate` | Abilita la punteggiatura (facoltativo) | | `smart_format` | `tools.media.audio.providerOptions.deepgram.smart_format` | Abilita la formattazione intelligente (facoltativo) | ```json5 { tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, }, } ``` ```json5 { tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, }, } ``` ## STT in streaming di Voice Call Il Plugin incluso `deepgram` registra anche un provider di trascrizione realtime per il Plugin Voice Call. | Impostazione | Percorso di configurazione | Predefinito | | ---------------- | ------------------------------------------------------------------------ | -------------------------------- | | Chiave API | `plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey` | Usa `DEEPGRAM_API_KEY` come fallback | | Modello | `...deepgram.model` | `nova-3` | | Lingua | `...deepgram.language` | (non impostata) | | Encoding | `...deepgram.encoding` | `mulaw` | | Frequenza di campionamento | `...deepgram.sampleRate` | `8000` | | Endpointing | `...deepgram.endpointingMs` | `800` | | Risultati intermedi | `...deepgram.interimResults` | `true` | ```json5 { plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "deepgram", providers: { deepgram: { apiKey: "${DEEPGRAM_API_KEY}", model: "nova-3", endpointingMs: 800, language: "en-US", }, }, }, }, }, }, }, } ``` Voice Call riceve audio telefonico come G.711 u-law a 8 kHz. Il provider streaming Deepgram usa come predefiniti `encoding: "mulaw"` e `sampleRate: 8000`, quindi i frame media di Twilio possono essere inoltrati direttamente. ## Note L'autenticazione segue l'ordine standard di autenticazione del provider. `DEEPGRAM_API_KEY` è il percorso più semplice. Sovrascrivi endpoint o header con `tools.media.audio.baseUrl` e `tools.media.audio.headers` quando usi un proxy. L'output segue le stesse regole audio degli altri provider (limiti di dimensione, timeout, iniezione della trascrizione). ## Correlati Panoramica della pipeline di elaborazione audio, immagini e video. Riferimento completo della configurazione, incluse le impostazioni degli strumenti media. Problemi comuni e passaggi di debug. Domande frequenti sulla configurazione di OpenClaw.