Providers

Gradium

Gradium jest dołączonym dostawcą zamiany tekstu na mowę dla OpenClaw. Plugin może generować zwykłe odpowiedzi audio (WAV), wyjście Opus zgodne z notatkami głosowymi oraz audio 8 kHz u-law dla powierzchni telefonicznych.

Właściwość	Wartość
Identyfikator dostawcy	`gradium`
Uwierzytelnianie	`GRADIUM_API_KEY` lub config `apiKey`
Bazowy URL	`https://api.gradium.ai` (domyślnie)
Domyślny głos	`Emma` (`YTpq7expH9539ERJ`)

Konfiguracja

Utwórz klucz API Gradium, a następnie udostępnij go OpenClaw za pomocą zmiennej środowiskowej albo klucza config.

Env var

bash

export GRADIUM_API_KEY="gsk_..."

Config key

json5

{  messages: {    tts: {      auto: "always",      provider: "gradium",      providers: {        gradium: {          apiKey: "${GRADIUM_API_KEY}",        },      },    },  },}

Plugin najpierw sprawdza rozwiązany apiKey, a w razie jego braku używa zmiennej środowiskowej GRADIUM_API_KEY.

Config

json5

{  messages: {    tts: {      auto: "always",      provider: "gradium",      providers: {        gradium: {          voiceId: "YTpq7expH9539ERJ",          // apiKey: "${GRADIUM_API_KEY}",          // baseUrl: "https://api.gradium.ai",        },      },    },  },}

Klucz	Typ	Opis
`messages.tts.providers.gradium.apiKey`	string	Rozwiązany klucz API. Obsługuje `${ENV}` i referencje do sekretów.
`messages.tts.providers.gradium.baseUrl`	string	Nadpisuje źródło API. Końcowe ukośniki są usuwane. Domyślnie `https://api.gradium.ai`.
`messages.tts.providers.gradium.voiceId`	string	Domyślny identyfikator głosu używany, gdy nie ma nadpisania dyrektywą.

Format wyjściowego audio jest wybierany automatycznie przez środowisko uruchomieniowe na podstawie powierzchni docelowej i nie można go konfigurować z openclaw.json. Zobacz Wyjście poniżej.

Głosy

Nazwa	Identyfikator głosu
Emma	`YTpq7expH9539ERJ`
Kent	`LFZvm12tW_z0xfGo`
Tiffany	`Eu9iL_CYe8N-Gkx_`
Christina	`2H4HY2CBNyJHBCrP`
Sydney	`jtEKaLYNn6iif5PR`
John	`KWJiFWu2O9nMPYcR`
Arthur	`3jUdJyOi9pgbxBTK`

Domyślny głos: Emma.

Nadpisanie głosu dla wiadomości

Gdy aktywna polityka mowy zezwala na nadpisywanie głosu, możesz przełączać głosy bezpośrednio w treści za pomocą tokenu dyrektywy. Wszystkie poniższe warianty rozwiązują się do tego samego nadpisania voiceId:

text

/voice:LFZvm12tW_z0xfGo/voice_id:LFZvm12tW_z0xfGo/voiceid:LFZvm12tW_z0xfGo/gradium_voice:LFZvm12tW_z0xfGo/gradiumvoice:LFZvm12tW_z0xfGo

Jeśli polityka mowy wyłącza nadpisywanie głosu, dyrektywa jest zużywana, ale ignorowana.

Wyjście

Środowisko uruchomieniowe wybiera format wyjściowy na podstawie powierzchni docelowej. Dostawca obecnie nie syntetyzuje innych formatów.

Cel	Format	Rozszerzenie pliku	Częstotliwość próbkowania	Flaga zgodności z głosem
Standardowe audio	`wav`	`.wav`	dostawca	nie
Notatka głosowa	`opus`	`.opus`	dostawca	tak
Telefonia	`ulaw_8000`	n/a	8 kHz	n/a

Kolejność automatycznego wyboru

Wśród skonfigurowanych dostawców TTS kolejność automatycznego wyboru Gradium to 30. Zobacz Zamiana tekstu na mowę, aby dowiedzieć się, jak OpenClaw wybiera aktywnego dostawcę, gdy messages.tts.provider nie jest przypięty.

Powiązane

Was this useful?