Providers

Deepgram

Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call عبر plugins.entries.voice-call.config.streaming.

في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram ويحقن النص المنسوخ في مسار الرد ({{Transcript}} + كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket ‏listen الخاصة بـ Deepgram ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.

التفصيل	القيمة
الموقع	deepgram.com
المستندات	developers.deepgram.com
المصادقة	`DEEPGRAM_API_KEY`
النموذج الافتراضي	`nova-3`

البدء

عيّن مفتاح API الخاص بك

أضف مفتاح Deepgram API إلى البيئة:

Code

DEEPGRAM_API_KEY=dg_...

فعّل موفّر الصوت

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

أرسل ملاحظة صوتية

أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OpenClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.

خيارات التهيئة

الخيار	المسار	الوصف
`model`	`tools.media.audio.models[].model`	معرّف نموذج Deepgram (الافتراضي: `nova-3`)
`language`	`tools.media.audio.models[].language`	تلميح اللغة (اختياري)
`detect_language`	`tools.media.audio.providerOptions.deepgram.detect_language`	تمكين اكتشاف اللغة (اختياري)
`punctuate`	`tools.media.audio.providerOptions.deepgram.punctuate`	تمكين علامات الترقيم (اختياري)
`smart_format`	`tools.media.audio.providerOptions.deepgram.smart_format`	تمكين التنسيق الذكي (اختياري)

مع تلميح اللغة

json5

{  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

مع خيارات Deepgram

json5

{  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

النسخ المتدفق في Voice Call

تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري لـ Plugin الخاصة بـ Voice Call.

الإعداد	مسار التهيئة	الافتراضي
مفتاح API	`plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`	يعود إلى `DEEPGRAM_API_KEY`
النموذج	`...deepgram.model`	`nova-3`
اللغة	`...deepgram.language`	(غير معيّنة)
الترميز	`...deepgram.encoding`	`mulaw`
معدل العينة	`...deepgram.sampleRate`	`8000`
Endpointing	`...deepgram.endpointingMs`	`800`
النتائج المرحلية	`...deepgram.interimResults`	`true`

json5

{  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

ملاحظات

المصادقة

تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY أبسط مسار.

Proxy ونقاط النهاية المخصصة

تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و tools.media.audio.headers عند استخدام proxy.

سلوك الإخراج

يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).

ذو صلة

أدوات الوسائط

نظرة عامة على خط معالجة الصوت والصور والفيديو.

التهيئة

مرجع التهيئة الكامل بما في ذلك إعدادات أداة الوسائط.

استكشاف الأخطاء وإصلاحها

المشكلات الشائعة وخطوات تصحيح الأخطاء.

الأسئلة الشائعة

الأسئلة المتكررة حول إعداد OpenClaw.

Was this useful?