Providers
Deepgram
Deepgram é uma API de speech-to-text. No OpenClaw, ela é usada para transcrição
de áudio/notas de voz de entrada por meio de tools.media.audio e para STT em streaming do Voice Call por meio de plugins.entries.voice-call.config.streaming.
Para transcrição em lote, o OpenClaw faz upload do arquivo de áudio completo para a Deepgram
e injeta a transcrição no pipeline de resposta ({{Transcript}} +
bloco [Audio]). Para STT em streaming do Voice Call, o OpenClaw encaminha frames
ao vivo G.711 u-law pelo endpoint WebSocket listen da Deepgram e emite transcrições
parciais ou finais conforme a Deepgram as retorna.
| Detalhe | Valor |
|---|---|
| Site | deepgram.com |
| Documentação | developers.deepgram.com |
| Auth | DEEPGRAM_API_KEY |
| Modelo padrão | nova-3 |
Primeiros passos
Defina sua chave de API
Adicione sua chave de API da Deepgram ao ambiente:
DEEPGRAM_API_KEY=dg_...Ative o provedor de áudio
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}Envie uma nota de voz
Envie uma mensagem de áudio por qualquer canal conectado. O OpenClaw a transcreve pela Deepgram e injeta a transcrição no pipeline de resposta.
Opções de configuração
| Opção | Caminho | Descrição |
|---|---|---|
model |
tools.media.audio.models[].model |
ID do modelo da Deepgram (padrão: nova-3) |
language |
tools.media.audio.models[].language |
Dica de idioma (opcional) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
Ativa detecção de idioma (opcional) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
Ativa pontuação (opcional) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
Ativa formatação inteligente (opcional) |
Com dica de idioma
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, },}Com opções da Deepgram
{ tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}STT em streaming do Voice Call
O Plugin empacotado deepgram também registra um provedor de transcrição em tempo real
para o Plugin Voice Call.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Chave de API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
Usa DEEPGRAM_API_KEY como fallback |
| Modelo | ...deepgram.model |
nova-3 |
| Idioma | ...deepgram.language |
(não definido) |
| Codificação | ...deepgram.encoding |
mulaw |
| Taxa de amostra | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| Resultados parciais | ...deepgram.interimResults |
true |
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "deepgram", providers: { deepgram: { apiKey: "${DEEPGRAM_API_KEY}", model: "nova-3", endpointingMs: 800, language: "en-US", }, }, }, }, }, }, },}Observações
Autenticação
A autenticação segue a ordem padrão de autenticação de provedor. DEEPGRAM_API_KEY é
o caminho mais simples.
Proxy e endpoints personalizados
Substitua endpoints ou cabeçalhos com tools.media.audio.baseUrl e
tools.media.audio.headers ao usar um proxy.
Comportamento da saída
A saída segue as mesmas regras de áudio dos outros provedores (limites de tamanho, timeouts, injeção de transcrição).