Providers

Deepgram

Deepgram — це API перетворення мовлення на текст. В OpenClaw він використовується для транскрипції вхідних аудіо/голосових повідомлень через tools.media.audio і для потокового STT у Voice Call через plugins.entries.voice-call.config.streaming.

Для пакетної транскрипції OpenClaw завантажує повний аудіофайл у Deepgram і інжектує транскрипт у конвеєр відповіді ({{Transcript}} + блок [Audio]). Для потокового Voice Call OpenClaw пересилає live кадри G.711 u-law через WebSocket-кінцеву точку Deepgram listen і надсилає часткові або фінальні транскрипти в міру того, як Deepgram їх повертає.

Деталь Значення
Вебсайт deepgram.com
Документація developers.deepgram.com
Автентифікація DEEPGRAM_API_KEY
Типова модель nova-3

Початок роботи

  • Установіть свій API-ключ

    Додайте свій API-ключ Deepgram до середовища:

    Code
    DEEPGRAM_API_KEY=dg_...
  • Увімкніть provider аудіо

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}
  • Надішліть голосове повідомлення

    Надішліть аудіоповідомлення через будь-який підключений канал. OpenClaw транскрибує його через Deepgram і інжектує транскрипт у конвеєр відповіді.

  • Параметри конфігурації

    Параметр Шлях Опис
    model tools.media.audio.models[].model id моделі Deepgram (типово: nova-3)
    language tools.media.audio.models[].language Підказка мови (необов’язково)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language Увімкнути визначення мови (необов’язково)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate Увімкнути пунктуацію (необов’язково)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format Увімкнути smart formatting (необов’язково)

    Із підказкою мови

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

    З параметрами Deepgram

    json5
    {  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

    Потоковий STT для Voice Call

    Вбудований Plugin deepgram також реєструє provider транскрипції в реальному часі для Plugin Voice Call.

    Налаштування Шлях конфігурації Типове значення
    API-ключ plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey Резервно використовує DEEPGRAM_API_KEY
    Модель ...deepgram.model nova-3
    Мова ...deepgram.language (не задано)
    Кодування ...deepgram.encoding mulaw
    Частота дискретизації ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    Проміжні результати ...deepgram.interimResults true
    json5
    {  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

    Примітки

    Автентифікація

    Автентифікація дотримується стандартного порядку автентифікації provider. DEEPGRAM_API_KEY — найпростіший шлях.

    Проксі та власні кінцеві точки

    Перевизначайте кінцеві точки або заголовки через tools.media.audio.baseUrl і tools.media.audio.headers, якщо використовуєте проксі.

    Поведінка виведення

    Виведення дотримується тих самих правил для аудіо, що й в інших provider (обмеження розміру, тайм-аути, інжекція транскрипту).

    Пов’язане

    Was this useful?