CLI commands
CLI الاستدلال
openclaw infer هو السطح القياسي بلا واجهة رسومية لسير عمل الاستدلال المدعومة بالمزوّدين.
يعرض عمدًا عائلات القدرات، وليس أسماء Gateway RPC الخام ولا معرّفات أدوات الوكيل الخام.
حوّل infer إلى skill
انسخ هذا والصقه في وكيل:
Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.ينبغي أن يقوم skill جيد قائم على infer بما يلي:
- ربط مقاصد المستخدم الشائعة بالأمر الفرعي الصحيح في infer
- تضمين بضعة أمثلة قياسية على infer لسير العمل التي يغطيها
- تفضيل
openclaw infer ...في الأمثلة والاقتراحات - تجنّب إعادة توثيق سطح infer بأكمله داخل متن skill
التغطية المعتادة للـ skill المركّز على infer:
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
لماذا تستخدم infer
يوفر openclaw infer واجهة CLI واحدة ومتسقة لمهام الاستدلال المدعومة بالمزوّدين داخل OpenClaw.
الفوائد:
- استخدم المزوّدين والنماذج المكوّنة بالفعل في OpenClaw بدلًا من إنشاء أغلفة مخصصة لمرة واحدة لكل واجهة خلفية.
- أبقِ سير عمل النماذج والصور ونسخ الصوت وTTS والفيديو والويب والتضمينات ضمن شجرة أوامر واحدة.
- استخدم بنية خرج مستقرة مع
--jsonللسكربتات والأتمتة وسير العمل المدفوعة بالوكلاء. - فضّل سطح OpenClaw من الطرف الأول عندما تكون المهمة أساسًا "تشغيل استدلال".
- استخدم المسار المحلي العادي دون الحاجة إلى Gateway لمعظم أوامر infer.
لفحوصات المزوّدين من البداية إلى النهاية، فضّل openclaw infer ... بعد أن تصبح اختبارات المزوّد ذات المستوى الأدنى خضراء. فهو يمرّن CLI المشحونة، وتحميل الإعدادات، وحلّ الوكيل الافتراضي، وتفعيل Plugin المضمّن، ووقت تشغيل القدرات المشترك قبل إجراء طلب المزوّد.
شجرة الأوامر
openclaw infer list inspect model run list inspect providers auth login auth logout auth status image generate edit describe describe-many providers audio transcribe providers tts convert voices providers status enable disable set-provider video generate describe providers web search fetch providers embedding create providersالمهام الشائعة
يربط هذا الجدول مهام الاستدلال الشائعة بأمر infer المقابل.
| المهمة | الأمر | الملاحظات |
|---|---|---|
| تشغيل مطالبة نصية/نموذج | openclaw infer model run --prompt "..." --json |
يستخدم المسار المحلي العادي افتراضيًا |
| تشغيل مطالبة نموذج على صور | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model |
كرر --file لإدخالات صور متعددة |
| توليد صورة | openclaw infer image generate --prompt "..." --json |
استخدم image edit عند البدء من ملف موجود |
| وصف ملف صورة | openclaw infer image describe --file ./image.png --prompt "..." --json |
يجب أن يكون --model نموذجًا قادرًا على الصور بصيغة <provider/model> |
| نسخ الصوت | openclaw infer audio transcribe --file ./memo.m4a --json |
يجب أن يكون --model بصيغة <provider/model> |
| تركيب الكلام | openclaw infer tts convert --text "..." --output ./speech.mp3 --json |
tts status موجّه إلى Gateway |
| توليد فيديو | openclaw infer video generate --prompt "..." --json |
يدعم تلميحات المزوّد مثل --resolution |
| وصف ملف فيديو | openclaw infer video describe --file ./clip.mp4 --json |
يجب أن يكون --model بصيغة <provider/model> |
| البحث في الويب | openclaw infer web search --query "..." --json |
|
| جلب صفحة ويب | openclaw infer web fetch --url https://example.com --json |
|
| إنشاء التضمينات | openclaw infer embedding create --text "..." --json |
السلوك
openclaw infer ...هو سطح CLI الأساسي لسير العمل هذه.- استخدم
--jsonعندما يستهلك أمر آخر أو سكربت الخرج. - استخدم
--providerأو--model provider/modelعندما تكون واجهة خلفية محددة مطلوبة. - استخدم
model run --thinking <level>لتمرير مستوى تفكير/استدلال لمرة واحدة (offأوminimalأوlowأوmediumأوhighأوadaptiveأوxhighأوmax) مع إبقاء التشغيل خامًا. - بالنسبة إلى
image describeوaudio transcribeوvideo describe، يجب أن يستخدم--modelالصيغة<provider/model>. - بالنسبة إلى
image describe، يشغّل--modelالصريح ذلك المزوّد/النموذج مباشرةً. يجب أن يكون النموذج قادرًا على الصور في كتالوج النماذج أو إعدادات المزوّد. يشغّلcodex/<model>دورة فهم صور محدودة عبر خادم تطبيق Codex؛ ويستخدمopenai-codex/<model>مسار مزوّد OpenAI Codex OAuth. - أوامر التنفيذ عديمة الحالة يكون الإعداد الافتراضي لها محليًا.
- أوامر الحالة المُدارة عبر Gateway يكون الإعداد الافتراضي لها Gateway.
- لا يتطلب المسار المحلي العادي تشغيل Gateway.
model runالمحلي هو إكمال مزوّد خفيف لمرة واحدة. يحل نموذج الوكيل والإذن المكوّنين، لكنه لا يبدأ دورة وكيل دردشة، ولا يحمّل أدوات، ولا يفتح خوادم MCP المضمّنة.- يقبل
model run --fileملفات الصور، ويكتشف نوع MIME الخاص بها، ويرسلها مع المطالبة المزوّدة إلى النموذج المحدد. كرر--fileلصور متعددة. - يرفض
model run --fileالإدخالات غير الصورية. استخدمinfer audio transcribeلملفات الصوت وinfer video describeلملفات الفيديو. - يمرّن
model run --gatewayتوجيه Gateway، والإذن المحفوظ، واختيار المزوّد، ووقت التشغيل المضمّن، لكنه يظل يعمل كمسبار نموذج خام: فهو يرسل المطالبة المزوّدة وأي مرفقات صور دون سجل جلسة سابق، أو سياق تمهيد/AGENTS، أو تجميع محرك السياق، أو أدوات، أو خوادم MCP مضمّنة. - يتطلب
model run --gateway --model <provider/model>اعتماد Gateway موثوقًا للمشغّل لأن الطلب يطلب من Gateway تشغيل تجاوز مزوّد/نموذج لمرة واحدة. - يستخدم
model run --thinkingالمحلي مسار إكمال المزوّد الخفيف؛ وتُطابَق المستويات الخاصة بالمزوّد مثلadaptiveوmaxإلى أقرب مستوى إكمال بسيط قابل للنقل.
النموذج
استخدم model للاستدلال النصي المدعوم بالمزوّدين وفحص النماذج/المزوّدين.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonopenclaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonopenclaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonopenclaw infer model run --prompt "Use more reasoning here" --thinking high --jsonopenclaw infer model providers --jsonopenclaw infer model inspect --name gpt-5.5 --jsonاستخدم مراجع <provider/model> الكاملة لإجراء اختبار دخان لمزوّد محدد دون بدء Gateway أو تحميل سطح أدوات الوكيل الكامل:
openclaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --jsonملاحظات:
model runالمحلي هو أضيق اختبار دخان عبر CLI لصحة المزوّد/النموذج/الإذن لأنه، بالنسبة إلى المزوّدين غير Codex، يرسل فقط المطالبة المزوّدة إلى النموذج المحدد.- يمكن لـ
model run --model <provider/model>المحلي استخدام صفوف الكتالوج الثابت المضمّنة الدقيقة منmodels list --allقبل كتابة ذلك المزوّد إلى الإعدادات. لا يزال إذن المزوّد مطلوبًا؛ تفشل بيانات الاعتماد المفقودة كأخطاء إذن، وليسUnknown model. - لمسابير الاستدلال في Mistral Medium 3.5، اترك درجة الحرارة غير مضبوطة/افتراضية. يرفض Mistral
reasoning_effort="high"معtemperature: 0؛ استخدمmistral/mistral-medium-3-5مع درجة الحرارة الافتراضية أو قيمة وضع استدلال غير صفرية مثل0.7. - المسابير المحلية
openai-codex/*هي الاستثناء الضيق: يضيف OpenClaw تعليمة نظامية دنيا حتى يتمكن نقل Codex Responses من ملء حقلinstructionsالمطلوب، دون إضافة سياق الوكيل الكامل، أو الأدوات، أو الذاكرة، أو سجل الجلسة. - يحافظ
model run --fileالمحلي على ذلك المسار الخفيف ويرفق محتوى الصورة مباشرةً برسالة المستخدم الواحدة. تعمل ملفات الصور الشائعة مثل PNG وJPEG وWebP عندما يُكتشف نوع MIME الخاص بها على أنهimage/*؛ تفشل الملفات غير المدعومة أو غير المعروفة قبل استدعاء المزوّد. - يكون
model run --fileهو الأفضل عندما تريد اختبار نموذج النص متعدد الوسائط المحدد مباشرةً. استخدمinfer image describeعندما تريد اختيار مزوّد فهم الصور في OpenClaw وتوجيه نموذج الصور الافتراضي. - يجب أن يدعم النموذج المحدد إدخال الصور؛ قد ترفض النماذج النصية فقط الطلب عند طبقة المزوّد.
- يجب أن يحتوي
model run --promptعلى نص غير فارغ؛ تُرفض المطالبات الفارغة قبل استدعاء المزوّدين المحليين أو Gateway. - يخرج
model runالمحلي بقيمة غير صفرية عندما لا يعيد المزوّد خرجًا نصيًا، لذلك لا تبدو المزوّدات المحلية غير القابلة للوصول والإكمالات الفارغة كمسابير ناجحة. - استخدم
model run --gatewayعندما تحتاج إلى اختبار توجيه Gateway، أو إعداد وقت تشغيل الوكيل، أو حالة المزوّد المُدارة عبر Gateway مع إبقاء إدخال النموذج خامًا. استخدمopenclaw agentأو أسطح الدردشة عندما تريد سياق الوكيل الكامل، والأدوات، والذاكرة، وسجل الجلسة. - يدير
model auth loginوmodel auth logoutوmodel auth statusحالة إذن المزوّد المحفوظة.
الصورة
استخدم image للتوليد والتحرير والوصف.
openclaw infer image generate --prompt "friendly lobster illustration" --jsonopenclaw infer image generate --prompt "cinematic product photo of headphones" --jsonopenclaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonopenclaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonopenclaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonopenclaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonopenclaw infer image describe --file ./photo.jpg --jsonopenclaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonopenclaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonopenclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonopenclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --jsonملاحظات:
-
استخدم
image editعند البدء من ملفات إدخال موجودة. -
استخدم
--sizeأو--aspect-ratioأو--resolutionمعimage editمن أجل المزوّدين/النماذج التي تدعم تلميحات الهندسة في تعديلات الصور المرجعية. -
استخدم
--output-format png --background transparentمع--model openai/gpt-image-1.5للحصول على مخرجات PNG بخلفية شفافة من OpenAI؛ يبقى--openai-backgroundمتاحًا كاسم بديل خاص بـ OpenAI. المزوّدون الذين لا يعلنون دعم الخلفية يبلّغون عن التلميح كتجاوز متجاهَل. -
استخدم
image providers --jsonللتحقق من مزوّدي الصور المضمّنين القابلين للاكتشاف والمهيّئين والمحددين، ومن إمكانات التوليد/التحرير التي يوفّرها كل مزوّد. -
استخدم
image generate --model <provider/model> --jsonكأضيق فحص مباشر عبر CLI لتغييرات توليد الصور. مثال:bash openclaw infer image providers --jsonopenclaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./openclaw-infer-image-smoke.png \ --jsonيبلّغ رد JSON عن
okوproviderوmodelوattemptsومسارات المخرجات المكتوبة. عند تعيين--output، قد يتبع الامتداد النهائي نوع MIME الذي أعاده المزوّد. -
بالنسبة إلى
image describeوimage describe-many، استخدم--promptلإعطاء نموذج الرؤية تعليمة خاصة بالمهمة مثل OCR أو المقارنة أو فحص واجهة المستخدم أو التعليق المختصر. -
استخدم
--timeout-msمع نماذج الرؤية المحلية البطيئة أو بدايات Ollama الباردة. -
بالنسبة إلى
image describe، يجب أن يكون--modelنموذجًا داعمًا للصور بصيغة<provider/model>. -
بالنسبة إلى نماذج الرؤية المحلية في Ollama، اسحب النموذج أولًا واضبط
OLLAMA_API_KEYعلى أي قيمة نائبة، مثلollama-local. راجع Ollama.
الصوت
استخدم audio لتفريغ الملفات صوتيًا.
openclaw infer audio transcribe --file ./memo.m4a --jsonopenclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonملاحظات:
audio transcribeمخصص لتفريغ الملفات صوتيًا، وليس لإدارة الجلسات في الوقت الحقيقي.- يجب أن يكون
--modelبصيغة<provider/model>.
TTS
استخدم tts لتركيب الكلام وحالة مزوّد TTS.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --jsonopenclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonopenclaw infer tts providers --jsonopenclaw infer tts status --jsonملاحظات:
- يستخدم
tts statusقيمة Gateway افتراضيًا لأنه يعكس حالة TTS المُدارة بواسطة Gateway. - استخدم
tts providersوtts voicesوtts set-providerلفحص سلوك TTS وتهيئته.
الفيديو
استخدم video للتوليد والوصف.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --jsonopenclaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonopenclaw infer video describe --file ./clip.mp4 --jsonopenclaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --jsonملاحظات:
- يقبل
video generateالخيارات--sizeو--aspect-ratioو--resolutionو--durationو--audioو--watermarkو--timeout-msويمررها إلى وقت تشغيل توليد الفيديو. - يجب أن يكون
--modelبصيغة<provider/model>من أجلvideo describe.
الويب
استخدم web لسير عمل البحث والجلب.
openclaw infer web search --query "OpenClaw docs" --jsonopenclaw infer web search --query "OpenClaw infer web providers" --jsonopenclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --jsonopenclaw infer web providers --jsonملاحظات:
- استخدم
web providersلفحص المزوّدين المتاحين والمهيّئين والمحددين.
التضمين
استخدم embedding لإنشاء المتجهات وفحص مزوّد التضمين.
openclaw infer embedding create --text "friendly lobster" --jsonopenclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonopenclaw infer embedding providers --jsonمخرجات JSON
تقوم أوامر Infer بتطبيع مخرجات JSON ضمن غلاف مشترك:
{ "ok": true, "capability": "image.generate", "transport": "local", "provider": "openai", "model": "gpt-image-2", "attempts": [], "outputs": []}الحقول العليا مستقرة:
okcapabilitytransportprovidermodelattemptsoutputserror
بالنسبة إلى أوامر الوسائط المولّدة، يحتوي outputs على الملفات التي كتبها OpenClaw. استخدم
path وmimeType وsize وأي أبعاد خاصة بالوسائط في تلك المصفوفة
للأتمتة بدلًا من تحليل stdout المقروء للبشر.
الأخطاء الشائعة
# Badopenclaw infer media image generate --prompt "friendly lobster" # Goodopenclaw infer image generate --prompt "friendly lobster"# Badopenclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # Goodopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonملاحظات
openclaw capability ...هو اسم بديل لـopenclaw infer ....