Providers
Deepgram
Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ
الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call
عبر plugins.entries.voice-call.config.streaming.
في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram
ويحقن النص المنسوخ في مسار الرد ({{Transcript}} +
كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw
إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket listen الخاصة بـ Deepgram
ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.
| التفصيل | القيمة |
|---|---|
| الموقع | deepgram.com |
| المستندات | developers.deepgram.com |
| المصادقة | DEEPGRAM_API_KEY |
| النموذج الافتراضي | nova-3 |
البدء
عيّن مفتاح API الخاص بك
أضف مفتاح Deepgram API إلى البيئة:
DEEPGRAM_API_KEY=dg_...فعّل موفّر الصوت
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}أرسل ملاحظة صوتية
أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OpenClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.
خيارات التهيئة
| الخيار | المسار | الوصف |
|---|---|---|
model |
tools.media.audio.models[].model |
معرّف نموذج Deepgram (الافتراضي: nova-3) |
language |
tools.media.audio.models[].language |
تلميح اللغة (اختياري) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
تمكين اكتشاف اللغة (اختياري) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
تمكين علامات الترقيم (اختياري) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
تمكين التنسيق الذكي (اختياري) |
مع تلميح اللغة
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, },}مع خيارات Deepgram
{ tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}النسخ المتدفق في Voice Call
تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري
لـ Plugin الخاصة بـ Voice Call.
| الإعداد | مسار التهيئة | الافتراضي |
|---|---|---|
| مفتاح API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
يعود إلى DEEPGRAM_API_KEY |
| النموذج | ...deepgram.model |
nova-3 |
| اللغة | ...deepgram.language |
(غير معيّنة) |
| الترميز | ...deepgram.encoding |
mulaw |
| معدل العينة | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| النتائج المرحلية | ...deepgram.interimResults |
true |
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "deepgram", providers: { deepgram: { apiKey: "${DEEPGRAM_API_KEY}", model: "nova-3", endpointingMs: 800, language: "en-US", }, }, }, }, }, }, },}ملاحظات
المصادقة
تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY
أبسط مسار.
Proxy ونقاط النهاية المخصصة
تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و
tools.media.audio.headers عند استخدام proxy.
سلوك الإخراج
يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).