Providers

Deepgram

Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call عبر plugins.entries.voice-call.config.streaming.

في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram ويحقن النص المنسوخ في مسار الرد ({{Transcript}} + كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket ‏listen الخاصة بـ Deepgram ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.

التفصيل القيمة
الموقع deepgram.com
المستندات developers.deepgram.com
المصادقة DEEPGRAM_API_KEY
النموذج الافتراضي nova-3

البدء

  • عيّن مفتاح API الخاص بك

    أضف مفتاح Deepgram API إلى البيئة:

    Code
    DEEPGRAM_API_KEY=dg_...
  • فعّل موفّر الصوت

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}
  • أرسل ملاحظة صوتية

    أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OpenClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.

  • خيارات التهيئة

    الخيار المسار الوصف
    model tools.media.audio.models[].model معرّف نموذج Deepgram (الافتراضي: nova-3)
    language tools.media.audio.models[].language تلميح اللغة (اختياري)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language تمكين اكتشاف اللغة (اختياري)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate تمكين علامات الترقيم (اختياري)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format تمكين التنسيق الذكي (اختياري)

    مع تلميح اللغة

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

    مع خيارات Deepgram

    json5
    {  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

    النسخ المتدفق في Voice Call

    تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري لـ Plugin الخاصة بـ Voice Call.

    الإعداد مسار التهيئة الافتراضي
    مفتاح API plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey يعود إلى DEEPGRAM_API_KEY
    النموذج ...deepgram.model nova-3
    اللغة ...deepgram.language (غير معيّنة)
    الترميز ...deepgram.encoding mulaw
    معدل العينة ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    النتائج المرحلية ...deepgram.interimResults true
    json5
    {  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

    ملاحظات

    المصادقة

    تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY أبسط مسار.

    Proxy ونقاط النهاية المخصصة

    تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و tools.media.audio.headers عند استخدام proxy.

    سلوك الإخراج

    يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).

    ذو صلة

    Was this useful?