CLI commands
CLI для інференсу
openclaw infer є канонічною headless-поверхнею для робочих процесів інференсу на базі провайдерів.
Вона навмисно надає сімейства можливостей, а не сирі назви Gateway RPC і не сирі ідентифікатори інструментів агента.
Перетворення infer на навичку
Скопіюйте й вставте це агенту:
Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.Хороша навичка на основі infer має:
- зіставляти типові наміри користувача з правильними підкомандами infer
- містити кілька канонічних прикладів infer для робочих процесів, які вона охоплює
- надавати перевагу
openclaw infer ...у прикладах і пропозиціях - уникати повторного документування всієї поверхні infer в тілі навички
Типове покриття навички, зосередженої на infer:
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Навіщо використовувати infer
openclaw infer надає один узгоджений CLI для завдань інференсу на базі провайдерів усередині OpenClaw.
Переваги:
- Використовуйте провайдерів і моделі, уже налаштовані в OpenClaw, замість створення разових обгорток для кожного бекенду.
- Тримайте робочі процеси для моделей, зображень, транскрибування аудіо, TTS, відео, вебу та embeddings в одному дереві команд.
- Використовуйте стабільну форму виводу
--jsonдля скриптів, автоматизації та робочих процесів, керованих агентом. - Надавайте перевагу першосторонній поверхні OpenClaw, коли завдання по суті полягає в "запуску інференсу".
- Використовуйте звичайний локальний шлях без потреби в Gateway для більшості команд infer.
Для наскрізних перевірок провайдерів надавайте перевагу openclaw infer ... після того, як низькорівневі
тести провайдера зелені. Це перевіряє поставлений CLI, завантаження конфігурації,
визначення агента за замовчуванням, активацію bundled Plugin і спільний runtime
можливостей до виконання запиту до провайдера.
Дерево команд
openclaw infer list inspect model run list inspect providers auth login auth logout auth status image generate edit describe describe-many providers audio transcribe providers tts convert voices providers status enable disable set-provider video generate describe providers web search fetch providers embedding create providersПоширені завдання
Ця таблиця зіставляє поширені завдання інференсу з відповідною командою infer.
| Завдання | Команда | Примітки |
|---|---|---|
| Запустити текстовий/модельний prompt | openclaw infer model run --prompt "..." --json |
Типово використовує звичайний локальний шлях |
| Запустити модельний prompt для зображень | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model |
Повторіть --file для кількох вхідних зображень |
| Згенерувати зображення | openclaw infer image generate --prompt "..." --json |
Використовуйте image edit, коли починаєте з наявного файлу |
| Описати файл зображення | openclaw infer image describe --file ./image.png --prompt "..." --json |
--model має бути image-capable <provider/model> |
| Транскрибувати аудіо | openclaw infer audio transcribe --file ./memo.m4a --json |
--model має бути <provider/model> |
| Синтезувати мовлення | openclaw infer tts convert --text "..." --output ./speech.mp3 --json |
tts status орієнтовано на Gateway |
| Згенерувати відео | openclaw infer video generate --prompt "..." --json |
Підтримує підказки провайдера, як-от --resolution |
| Описати відеофайл | openclaw infer video describe --file ./clip.mp4 --json |
--model має бути <provider/model> |
| Шукати в інтернеті | openclaw infer web search --query "..." --json |
|
| Отримати вебсторінку | openclaw infer web fetch --url https://example.com --json |
|
| Створити embeddings | openclaw infer embedding create --text "..." --json |
Поведінка
openclaw infer ...є основною поверхнею CLI для цих робочих процесів.- Використовуйте
--json, коли вивід споживатиме інша команда або скрипт. - Використовуйте
--providerабо--model provider/model, коли потрібен конкретний бекенд. - Використовуйте
model run --thinking <level>, щоб передати одноразовий рівень thinking/reasoning (off,minimal,low,medium,high,adaptive,xhighабоmax), зберігаючи запуск сирим. - Для
image describe,audio transcribeіvideo describe--modelмає використовувати форму<provider/model>. - Для
image describeявний--modelзапускає цей provider/model напряму. Модель має бути image-capable у каталозі моделей або конфігурації провайдера.codex/<model>запускає обмежений хід розуміння зображення через сервер застосунку Codex;openai-codex/<model>використовує шлях провайдера OpenAI Codex OAuth. - Команди stateless-виконання типово локальні.
- Команди стану, керовані Gateway, типово використовують Gateway.
- Звичайний локальний шлях не потребує запущеного Gateway.
- Локальний
model runє легким одноразовим provider completion. Він визначає налаштовану модель агента й автентифікацію, але не запускає chat-agent turn, не завантажує інструменти й не відкриває bundled MCP servers. model run --fileприймає файли зображень, визначає їхній MIME-тип і надсилає їх із наданим prompt до вибраної моделі. Повторіть--fileдля кількох зображень.model run --fileвідхиляє вхідні дані, що не є зображеннями. Використовуйтеinfer audio transcribeдля аудіофайлів іinfer video describeдля відеофайлів.model run --gatewayперевіряє маршрутизацію Gateway, збережену автентифікацію, вибір провайдера та вбудований runtime, але все одно працює як сирий model probe: він надсилає наданий prompt і будь-які вкладення зображень без попереднього transcript сесії, контексту bootstrap/AGENTS, складання context-engine, інструментів або bundled MCP servers.model run --gateway --model <provider/model>потребує довірених облікових даних оператора Gateway, бо запит просить Gateway виконати одноразове перевизначення provider/model.- Локальний
model run --thinkingвикористовує легкий шлях provider-completion; специфічні для провайдера рівні, як-отadaptiveіmax, зіставляються з найближчим портативним рівнем simple-completion.
Модель
Використовуйте model для текстового інференсу на базі провайдерів і перевірки моделей/провайдерів.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonopenclaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonopenclaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonopenclaw infer model run --prompt "Use more reasoning here" --thinking high --jsonopenclaw infer model providers --jsonopenclaw infer model inspect --name gpt-5.5 --jsonВикористовуйте повні посилання <provider/model>, щоб smoke-test конкретного провайдера без
запуску Gateway або завантаження повної поверхні інструментів агента:
openclaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --jsonПримітки:
- Локальний
model runє найвужчим CLI smoke для стану provider/model/auth, бо для провайдерів, що не є Codex, він надсилає лише наданий prompt до вибраної моделі. - Локальний
model run --model <provider/model>може використовувати точні bundled static catalog rows зmodels list --allдо того, як цей провайдер буде записано в конфігурацію. Автентифікація провайдера все одно потрібна; відсутні облікові дані завершуються помилками автентифікації, а неUnknown model. - Для reasoning probes Mistral Medium 3.5 залиште temperature не встановленою/типовою. Mistral відхиляє
reasoning_effort="high"плюсtemperature: 0; використовуйтеmistral/mistral-medium-3-5з типовою temperature або ненульовим значенням reasoning-mode, як-от0.7. - Локальні probes
openai-codex/*є вузьким винятком: OpenClaw додає мінімальну системну інструкцію, щоб транспорт Codex Responses міг заповнити своє обов’язкове полеinstructions, без додавання повного контексту агента, інструментів, пам’яті або transcript сесії. - Локальний
model run --fileзберігає цей легкий шлях і прикріплює вміст зображення напряму до одного повідомлення користувача. Типові файли зображень, як-от PNG, JPEG і WebP, працюють, коли їхній MIME-тип визначено якimage/*; непідтримувані або нерозпізнані файли завершуються помилкою до виклику провайдера. model run --fileнайкраще підходить, коли потрібно протестувати вибрану multimodal text model напряму. Використовуйтеinfer image describe, коли потрібні вибір провайдера розуміння зображень OpenClaw і типова маршрутизація image-model.- Вибрана модель має підтримувати вхідні зображення; text-only models можуть відхилити запит на рівні провайдера.
model run --promptмає містити текст, що не складається лише з пробілів; порожні prompts відхиляються до виклику локальних провайдерів або Gateway.- Локальний
model runзавершується з ненульовим кодом, коли провайдер не повертає текстовий вивід, тому недоступні локальні провайдери й порожні completions не виглядають як успішні probes. - Використовуйте
model run --gateway, коли потрібно протестувати маршрутизацію Gateway, налаштування agent-runtime або стан провайдера, керований Gateway, зберігаючи вхід моделі сирим. Використовуйтеopenclaw agentабо chat-поверхні, коли потрібен повний контекст агента, інструменти, пам’ять і transcript сесії. model auth login,model auth logoutіmodel auth statusкерують збереженим станом автентифікації провайдера.
Зображення
Використовуйте image для генерації, редагування та опису.
openclaw infer image generate --prompt "friendly lobster illustration" --jsonopenclaw infer image generate --prompt "cinematic product photo of headphones" --jsonopenclaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonopenclaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonopenclaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonopenclaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonopenclaw infer image describe --file ./photo.jpg --jsonopenclaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonopenclaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonopenclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonopenclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --jsonПримітки:
-
Використовуйте
image edit, коли починаєте з наявних вхідних файлів. -
Використовуйте
--size,--aspect-ratioабо--resolutionзimage editдля провайдерів/моделей, які підтримують підказки геометрії під час редагування референсних зображень. -
Використовуйте
--output-format png --background transparentз--model openai/gpt-image-1.5для виводу OpenAI PNG із прозорим тлом;--openai-backgroundлишається доступним як псевдонім, специфічний для OpenAI. Провайдери, які не оголошують підтримку тла, повідомляють про підказку як про проігнороване перевизначення. -
Використовуйте
image providers --json, щоб перевірити, які вбудовані провайдери зображень можна виявити, налаштувати, вибрати, а також які можливості генерації/редагування надає кожен провайдер. -
Використовуйте
image generate --model <provider/model> --jsonяк найвужчий живий CLI smoke для змін генерації зображень. Приклад:bash openclaw infer image providers --jsonopenclaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./openclaw-infer-image-smoke.png \ --jsonВідповідь JSON повідомляє
ok,provider,model,attemptsі записані шляхи виводу. Коли задано--output, кінцеве розширення може відповідати MIME-типу, повернутому провайдером. -
Для
image describeтаimage describe-manyвикористовуйте--prompt, щоб дати моделі зору інструкцію для конкретного завдання, як-от OCR, порівняння, інспекція UI або стисле підписування. -
Використовуйте
--timeout-msз повільними локальними моделями зору або холодними запусками Ollama. -
Для
image describe--modelмає бути моделлю<provider/model>з підтримкою зображень. -
Для локальних моделей зору Ollama спочатку завантажте модель і встановіть
OLLAMA_API_KEYу будь-яке значення-заповнювач, наприкладollama-local. Див. Ollama.
Аудіо
Використовуйте audio для транскрибування файлів.
openclaw infer audio transcribe --file ./memo.m4a --jsonopenclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonПримітки:
audio transcribeпризначено для транскрибування файлів, а не для керування сеансами в реальному часі.--modelмає бути<provider/model>.
TTS
Використовуйте tts для синтезу мовлення та стану TTS-провайдера.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --jsonopenclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonopenclaw infer tts providers --jsonopenclaw infer tts status --jsonПримітки:
tts statusза замовчуванням використовує Gateway, бо відображає стан TTS, керований Gateway.- Використовуйте
tts providers,tts voicesіtts set-provider, щоб переглядати та налаштовувати поведінку TTS.
Відео
Використовуйте video для генерації та опису.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --jsonopenclaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonopenclaw infer video describe --file ./clip.mp4 --jsonopenclaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --jsonПримітки:
video generateприймає--size,--aspect-ratio,--resolution,--duration,--audio,--watermarkі--timeout-msта передає їх до середовища виконання генерації відео.--modelмає бути<provider/model>дляvideo describe.
Веб
Використовуйте web для робочих процесів пошуку та отримання.
openclaw infer web search --query "OpenClaw docs" --jsonopenclaw infer web search --query "OpenClaw infer web providers" --jsonopenclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --jsonopenclaw infer web providers --jsonПримітки:
- Використовуйте
web providers, щоб переглянути доступних, налаштованих і вибраних провайдерів.
Вбудовування
Використовуйте embedding для створення векторів та інспекції провайдерів вбудовувань.
openclaw infer embedding create --text "friendly lobster" --jsonopenclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonopenclaw infer embedding providers --jsonВивід JSON
Команди infer нормалізують вивід JSON у спільній оболонці:
{ "ok": true, "capability": "image.generate", "transport": "local", "provider": "openai", "model": "gpt-image-2", "attempts": [], "outputs": []}Поля верхнього рівня стабільні:
okcapabilitytransportprovidermodelattemptsoutputserror
Для команд згенерованих медіа outputs містить файли, записані OpenClaw. Використовуйте
path, mimeType, size і будь-які специфічні для медіа розміри в цьому масиві
для автоматизації замість парсингу читабельного для людини stdout.
Поширені помилки
# Badopenclaw infer media image generate --prompt "friendly lobster" # Goodopenclaw infer image generate --prompt "friendly lobster"# Badopenclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # Goodopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonПримітки
openclaw capability ...є псевдонімом дляopenclaw infer ....