---
read_when:
    - Vuoi speech-to-text di Deepgram per allegati audio
    - Vuoi la trascrizione in streaming di Deepgram per Voice Call
    - Hai bisogno di un rapido esempio di configurazione Deepgram
summary: Trascrizione Deepgram per le note vocali in ingresso
title: Deepgram
x-i18n:
    generated_at: "2026-04-25T13:55:18Z"
    model: gpt-5.4
    provider: openai
    source_hash: 9d591aa24a5477fd9fe69b7a0dc44b204d28ea0c2f89e6dfef66f9ceb76da34d
    source_path: providers/deepgram.md
    workflow: 15
---

Deepgram è un'API di speech-to-text. In OpenClaw viene usata per la
trascrizione in ingresso di audio/note vocali tramite `tools.media.audio` e per la STT in streaming di Voice Call tramite `plugins.entries.voice-call.config.streaming`.

Per la trascrizione batch, OpenClaw carica il file audio completo su Deepgram
e inietta la trascrizione nella pipeline di risposta (`{{Transcript}}` +
blocco `[Audio]`). Per la trascrizione in streaming di Voice Call, OpenClaw inoltra frame live G.711
u-law tramite l'endpoint WebSocket `listen` di Deepgram ed emette trascrizioni parziali o
finali man mano che Deepgram le restituisce.

| Dettaglio      | Valore                                                     |
| -------------- | ---------------------------------------------------------- |
| Sito web       | [deepgram.com](https://deepgram.com)                       |
| Documentazione | [developers.deepgram.com](https://developers.deepgram.com) |
| Autenticazione | `DEEPGRAM_API_KEY`                                         |
| Modello predefinito | `nova-3`                                              |

## Per iniziare

<Steps>
  <Step title="Imposta la tua chiave API">
    Aggiungi la tua chiave API Deepgram all'ambiente:

    ```
    DEEPGRAM_API_KEY=dg_...
    ```

  </Step>
  <Step title="Abilita il provider audio">
    ```json5
    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    ```
  </Step>
  <Step title="Invia una nota vocale">
    Invia un messaggio audio tramite qualsiasi canale collegato. OpenClaw lo trascrive
    tramite Deepgram e inietta la trascrizione nella pipeline di risposta.
  </Step>
</Steps>

## Opzioni di configurazione

| Opzione          | Percorso                                                     | Descrizione                           |
| ---------------- | ------------------------------------------------------------ | ------------------------------------- |
| `model`          | `tools.media.audio.models[].model`                           | Id modello Deepgram (predefinito: `nova-3`) |
| `language`       | `tools.media.audio.models[].language`                        | Suggerimento lingua (facoltativo)     |
| `detect_language` | `tools.media.audio.providerOptions.deepgram.detect_language` | Abilita il rilevamento della lingua (facoltativo) |
| `punctuate`      | `tools.media.audio.providerOptions.deepgram.punctuate`       | Abilita la punteggiatura (facoltativo) |
| `smart_format`   | `tools.media.audio.providerOptions.deepgram.smart_format`    | Abilita la formattazione intelligente (facoltativo) |

<Tabs>
  <Tab title="Con suggerimento lingua">
    ```json5
    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
          },
        },
      },
    }
    ```
  </Tab>
  <Tab title="Con opzioni Deepgram">
    ```json5
    {
      tools: {
        media: {
          audio: {
            enabled: true,
            providerOptions: {
              deepgram: {
                detect_language: true,
                punctuate: true,
                smart_format: true,
              },
            },
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    ```
  </Tab>
</Tabs>

## STT in streaming di Voice Call

Il Plugin incluso `deepgram` registra anche un provider di trascrizione realtime
per il Plugin Voice Call.

| Impostazione     | Percorso di configurazione                                               | Predefinito                      |
| ---------------- | ------------------------------------------------------------------------ | -------------------------------- |
| Chiave API       | `plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`  | Usa `DEEPGRAM_API_KEY` come fallback |
| Modello          | `...deepgram.model`                                                      | `nova-3`                         |
| Lingua           | `...deepgram.language`                                                   | (non impostata)                  |
| Encoding         | `...deepgram.encoding`                                                   | `mulaw`                          |
| Frequenza di campionamento | `...deepgram.sampleRate`                                        | `8000`                           |
| Endpointing      | `...deepgram.endpointingMs`                                              | `800`                            |
| Risultati intermedi | `...deepgram.interimResults`                                          | `true`                           |

```json5
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}
```

<Note>
Voice Call riceve audio telefonico come G.711 u-law a 8 kHz. Il provider
streaming Deepgram usa come predefiniti `encoding: "mulaw"` e `sampleRate: 8000`, quindi
i frame media di Twilio possono essere inoltrati direttamente.
</Note>

## Note

<AccordionGroup>
  <Accordion title="Autenticazione">
    L'autenticazione segue l'ordine standard di autenticazione del provider. `DEEPGRAM_API_KEY` è
    il percorso più semplice.
  </Accordion>
  <Accordion title="Proxy ed endpoint personalizzati">
    Sovrascrivi endpoint o header con `tools.media.audio.baseUrl` e
    `tools.media.audio.headers` quando usi un proxy.
  </Accordion>
  <Accordion title="Comportamento dell'output">
    L'output segue le stesse regole audio degli altri provider (limiti di dimensione, timeout,
    iniezione della trascrizione).
  </Accordion>
</AccordionGroup>

## Correlati

<CardGroup cols={2}>
  <Card title="Strumenti media" href="/it/tools/media-overview" icon="photo-film">
    Panoramica della pipeline di elaborazione audio, immagini e video.
  </Card>
  <Card title="Configurazione" href="/it/gateway/configuration" icon="gear">
    Riferimento completo della configurazione, incluse le impostazioni degli strumenti media.
  </Card>
  <Card title="Risoluzione dei problemi" href="/it/help/troubleshooting" icon="wrench">
    Problemi comuni e passaggi di debug.
  </Card>
  <Card title="FAQ" href="/it/help/faq" icon="circle-question">
    Domande frequenti sulla configurazione di OpenClaw.
  </Card>
</CardGroup>
