Concepts and configuration

Постачальники моделей

Довідка для постачальників LLM/моделей (не каналів чату, як-от WhatsApp/Telegram). Правила вибору моделей див. у Моделі.

Короткі правила

Посилання на моделі та помічники CLI

Посилання на моделі використовують provider/model (приклад: opencode/claude-opus-4-6).
agents.defaults.models діє як allowlist, коли задано.
Помічники CLI: openclaw onboard, openclaw models list, openclaw models set <provider/model>.
models.providers.*.contextWindow / contextTokens / maxTokens задають типові значення на рівні постачальника; models.providers.*.models[].contextWindow / contextTokens / maxTokens перевизначають їх для окремої моделі.
Правила резервного перемикання, перевірки cooldown і збереження перевизначень сеансу: Резервне перемикання моделей.

Додавання автентифікації постачальника не змінює вашу основну модель

openclaw configure зберігає наявне agents.defaults.model.primary, коли ви додаєте або повторно автентифікуєте постачальника. openclaw models auth login робить те саме, якщо не передати --set-default. Plugin постачальника все ще може повернути рекомендовану типову модель у своєму патчі конфігурації автентифікації, але OpenClaw трактує це як «зробити цю модель доступною», коли основна модель уже існує, а не як «замінити поточну основну модель».

Щоб навмисно перемкнути типову модель, використайте openclaw models set <provider/model> або openclaw models auth login --provider <id> --set-default.

Розділення постачальника й runtime OpenAI

Маршрути сімейства OpenAI залежать від префікса:

openai/<model> типово використовує нативний harness сервера застосунку Codex для кроків агента. Це звичайне налаштування підписки ChatGPT/Codex.
openai-codex/<model> — це застаріла конфігурація, яку doctor переписує на openai/<model>.
openai/<model> плюс provider/model agentRuntime.id: "pi" використовує PI для явних маршрутів API-ключа або сумісності.

Див. OpenAI і harness Codex. Якщо розділення постачальника й runtime незрозуміле, спершу прочитайте Runtime агентів.

Автоматичне ввімкнення Plugin дотримується тієї самої межі: посилання агентів openai/* вмикають Plugin Codex для типового маршруту, а явні provider/model agentRuntime.id: "codex" або застарілі посилання codex/<model> також потребують його.

GPT-5.5 типово доступна через нативний harness сервера застосунку Codex на openai/gpt-5.5, а через PI лише тоді, коли політика runtime provider/model явно вибирає pi.

Runtime CLI

Runtime CLI використовують те саме розділення: виберіть канонічні посилання на моделі, як-от anthropic/claude-*, google/gemini-* або openai/gpt-*, а потім задайте політику runtime provider/model як claude-cli, google-gemini-cli або codex-cli, коли потрібен локальний бекенд CLI.

Застарілі посилання claude-cli/*, google-gemini-cli/* і codex-cli/* мігрують назад до канонічних посилань постачальника з runtime, записаним окремо.

Поведінка постачальника, якою володіє Plugin

Більшість специфічної для постачальника логіки живе в Plugin постачальника (registerProvider(...)), тоді як OpenClaw зберігає загальний цикл інференсу. Plugin володіють onboarding, каталогами моделей, зіставленням env-var автентифікації, нормалізацією транспорту/конфігурації, очищенням tool-schema, класифікацією failover, оновленням OAuth, звітуванням про використання, профілями thinking/reasoning тощо.

Повний список хуків provider-SDK і приклади вбудованих Plugin наведено в Plugin постачальників. Постачальник, якому потрібен повністю власний виконавець запитів, є окремою, глибшою поверхнею розширення.

Ротація API-ключів

Джерела ключів і пріоритет

Налаштуйте кілька ключів через:

OPENCLAW_LIVE_<PROVIDER>_KEY (одне live-перевизначення, найвищий пріоритет)
<PROVIDER>_API_KEYS (список через кому або крапку з комою)
<PROVIDER>_API_KEY (основний ключ)
<PROVIDER>_API_KEY_* (нумерований список, напр. <PROVIDER>_API_KEY_1)

Для постачальників Google GOOGLE_API_KEY також включено як fallback. Порядок вибору ключів зберігає пріоритет і усуває дублікати значень.

Коли спрацьовує ротація

Запити повторюються з наступним ключем лише на відповідях про rate-limit (наприклад, 429, rate_limit, quota, resource exhausted, Too many concurrent requests, ThrottlingException, concurrency limit reached, workers_ai ... quota limit exceeded або періодичні повідомлення про ліміт використання).
Збої, не пов’язані з rate-limit, одразу завершуються помилкою; ротація ключів не виконується.
Коли всі ключі-кандидати зазнають невдачі, фінальна помилка повертається з останньої спроби.

Вбудовані постачальники (каталог pi-ai)

OpenClaw постачається з каталогом pi-ai. Ці постачальники не потребують конфігурації models.providers; просто задайте автентифікацію та виберіть модель.

OpenAI

Постачальник: openai
Автентифікація: OPENAI_API_KEY
Опціональна ротація: OPENAI_API_KEYS, OPENAI_API_KEY_1, OPENAI_API_KEY_2, плюс OPENCLAW_LIVE_OPENAI_KEY (одне перевизначення)
Приклади моделей: openai/gpt-5.5, openai/gpt-5.4-mini
Перевірте доступність облікового запису/моделі за допомогою openclaw models list --provider openai, якщо конкретне встановлення або API-ключ поводиться інакше.
CLI: openclaw onboard --auth-choice openai-api-key
Типовий транспорт — auto; OpenClaw передає вибір транспорту до pi-ai.
Перевизначення для окремої моделі через agents.defaults.models["openai/<model>"].params.transport ("sse", "websocket" або "auto")
Пріоритетну обробку OpenAI можна ввімкнути через agents.defaults.models["openai/<model>"].params.serviceTier
/fast і params.fastMode зіставляють прямі запити Responses openai/* з service_tier=priority на api.openai.com
Використовуйте params.serviceTier, коли потрібен явний tier замість спільного перемикача /fast
Приховані заголовки атрибуції OpenClaw (originator, version, User-Agent) застосовуються лише до нативного трафіку OpenAI до api.openai.com, а не до загальних OpenAI-сумісних проксі
Нативні маршрути OpenAI також зберігають Responses store, підказки prompt-cache і формування payload для сумісності з reasoning OpenAI; маршрути проксі — ні
openai/gpt-5.3-codex-spark навмисно приховано в OpenClaw, оскільки live-запити OpenAI API відхиляють його, а поточний каталог Codex не експонує його

json5

{  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}

Anthropic

Постачальник: anthropic
Автентифікація: ANTHROPIC_API_KEY
Опціональна ротація: ANTHROPIC_API_KEYS, ANTHROPIC_API_KEY_1, ANTHROPIC_API_KEY_2, плюс OPENCLAW_LIVE_ANTHROPIC_KEY (одне перевизначення)
Приклад моделі: anthropic/claude-opus-4-6
CLI: openclaw onboard --auth-choice apiKey
Прямі публічні запити Anthropic підтримують спільний перемикач /fast і params.fastMode, включно з трафіком, автентифікованим API-ключем і OAuth, надісланим до api.anthropic.com; OpenClaw зіставляє це з Anthropic service_tier (auto проти standard_only)
Бажана конфігурація Claude CLI зберігає посилання на модель канонічним і вибирає CLI бекенд окремо: anthropic/claude-opus-4-7 з model-scoped agentRuntime.id: "claude-cli". Застарілі посилання claude-cli/claude-opus-4-7 усе ще працюють для сумісності.

json5

{  agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },}

OpenAI Codex OAuth

Постачальник: openai-codex
Автентифікація: OAuth (ChatGPT)
Застаріле посилання на модель PI: openai-codex/gpt-5.5
Посилання нативного harness сервера застосунку Codex: openai/gpt-5.5
Документація нативного harness сервера застосунку Codex: harness Codex
Застарілі посилання на моделі: codex/gpt-*
Межа Plugin: openai-codex/* завантажує Plugin OpenAI; нативний Plugin сервера застосунку Codex вибирається лише runtime harness Codex або застарілими посиланнями codex/*.
CLI: openclaw onboard --auth-choice openai-codex або openclaw models auth login --provider openai-codex
Типовий транспорт — auto (спочатку WebSocket, SSE як fallback)
Перевизначення для окремої моделі PI через agents.defaults.models["openai-codex/<model>"].params.transport ("sse", "websocket" або "auto")
params.serviceTier також передається в нативних запитах Codex Responses (chatgpt.com/backend-api)
Приховані заголовки атрибуції OpenClaw (originator, version, User-Agent) додаються лише до нативного трафіку Codex до chatgpt.com/backend-api, а не до загальних OpenAI-сумісних проксі
Використовує ту саму конфігурацію перемикача /fast і params.fastMode, що й прямі openai/*; OpenClaw зіставляє це з service_tier=priority
openai-codex/gpt-5.5 використовує нативні для каталогу Codex contextWindow = 400000 і типовий runtime contextTokens = 272000; перевизначте обмеження runtime за допомогою models.providers.openai-codex.models[].contextTokens
Примітка щодо політики: OpenAI Codex OAuth явно підтримується для зовнішніх інструментів/робочих процесів, як-от OpenClaw.
Для поширеного маршруту з підпискою плюс нативним runtime Codex увійдіть з автентифікацією openai-codex, але налаштуйте openai/gpt-5.5; кроки агента OpenAI типово вибирають Codex.
Використовуйте provider/model agentRuntime.id: "pi" лише тоді, коли потрібен маршрут сумісності через PI; інакше залишайте openai/gpt-5.5 на типовому harness Codex.
Старіші посилання openai-codex/gpt-5.1*, openai-codex/gpt-5.2* і openai-codex/gpt-5.3* приховано, оскільки облікові записи ChatGPT/Codex OAuth відхиляють їх; натомість використовуйте openai-codex/gpt-5.5 або нативний маршрут runtime Codex.

json5

{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },}

json5

{  models: {    providers: {      "openai-codex": {        models: [{ id: "gpt-5.5", contextTokens: 160000 }],      },    },  },}

Інші розміщені варіанти в стилі підписки

Моделі GLM

Z.AI Coding Plan або загальні API-ендпоїнти.

MiniMax

MiniMax Coding Plan OAuth або доступ за API-ключем.

Qwen Cloud

Поверхня постачальника Qwen Cloud плюс зіставлення ендпоїнтів Alibaba DashScope і Coding Plan.

OpenCode

Автентифікація: OPENCODE_API_KEY (або OPENCODE_ZEN_API_KEY)
Постачальник runtime Zen: opencode
Постачальник runtime Go: opencode-go
Приклади моделей: opencode/claude-opus-4-6, opencode-go/kimi-k2.6
CLI: openclaw onboard --auth-choice opencode-zen або openclaw onboard --auth-choice opencode-go

json5

{  agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },}

Google Gemini (API-ключ)

Провайдер: google
Автентифікація: GEMINI_API_KEY
Необов’язкова ротація: GEMINI_API_KEYS, GEMINI_API_KEY_1, GEMINI_API_KEY_2, резервний GOOGLE_API_KEY і OPENCLAW_LIVE_GEMINI_KEY (одинарне перевизначення)
Приклади моделей: google/gemini-3.1-pro-preview, google/gemini-3-flash-preview
Сумісність: застаріла конфігурація OpenClaw, що використовує google/gemini-3.1-flash-preview, нормалізується до google/gemini-3-flash-preview
Псевдонім: google/gemini-3.1-pro приймається й нормалізується до live ID API Gemini від Google, google/gemini-3.1-pro-preview
CLI: openclaw onboard --auth-choice gemini-api-key
Мислення: /think adaptive використовує динамічне мислення Google. Gemini 3/3.1 не вказують фіксований thinkingLevel; Gemini 2.5 надсилає thinkingBudget: -1.
Прямі запуски Gemini також приймають agents.defaults.models["google/<model>"].params.cachedContent (або застарілий cached_content), щоб передати нативний для провайдера дескриптор cachedContents/...; влучання кешу Gemini відображаються як OpenClaw cacheRead

Google Vertex і Gemini CLI

Провайдери: google-vertex, google-gemini-cli
Автентифікація: Vertex використовує gcloud ADC; Gemini CLI використовує свій потік OAuth

Gemini CLI OAuth постачається як частина вбудованого Plugin google.

Установіть Gemini CLI

brew

bash

brew install gemini-cli

npm

bash

npm install -g @google/gemini-cli

Увімкніть Plugin

bash

openclaw plugins enable google

Увійдіть

bash

openclaw models auth login --provider google-gemini-cli --set-default

Модель за замовчуванням: google-gemini-cli/gemini-3-flash-preview. Ви не вставляєте ідентифікатор клієнта чи секрет у openclaw.json. Потік входу CLI зберігає токени в профілях автентифікації на хості Gateway.

Налаштуйте проєкт (за потреби)

Якщо запити не виконуються після входу, задайте GOOGLE_CLOUD_PROJECT або GOOGLE_CLOUD_PROJECT_ID на хості Gateway.

Відповіді Gemini CLI JSON аналізуються з response; використання повертається до stats, а stats.cached нормалізується в OpenClaw cacheRead.

Z.AI (GLM)

Провайдер: zai
Автентифікація: ZAI_API_KEY
Приклад моделі: zai/glm-5.1
CLI: openclaw onboard --auth-choice zai-api-key
- Псевдоніми: z.ai/* і z-ai/* нормалізуються до zai/*
- zai-api-key автоматично визначає відповідну кінцеву точку Z.AI; zai-coding-global, zai-coding-cn, zai-global і zai-cn примусово задають конкретну поверхню

Vercel AI Gateway

Провайдер: vercel-ai-gateway
Автентифікація: AI_GATEWAY_API_KEY
Приклади моделей: vercel-ai-gateway/anthropic/claude-opus-4.6, vercel-ai-gateway/moonshotai/kimi-k2.6
CLI: openclaw onboard --auth-choice ai-gateway-api-key

Kilo Gateway

Провайдер: kilocode
Автентифікація: KILOCODE_API_KEY
Приклад моделі: kilocode/kilo/auto
CLI: openclaw onboard --auth-choice kilocode-api-key
Базова URL-адреса: https://api.kilo.ai/api/gateway/
Статичний резервний каталог постачає kilocode/kilo/auto; live-виявлення https://api.kilo.ai/api/gateway/models може додатково розширити каталог часу виконання.
Точна upstream-маршрутизація за kilocode/kilo/auto належить Kilo Gateway, а не жорстко закодована в OpenClaw.

Див. /providers/kilocode, щоб отримати деталі налаштування.

Інші вбудовані Plugin провайдерів

Постачальник	ID	Змінна середовища автентифікації	Приклад моделі
BytePlus	`byteplus` / `byteplus-plan`	`BYTEPLUS_API_KEY`	`byteplus-plan/ark-code-latest`
Cerebras	`cerebras`	`CEREBRAS_API_KEY`	`cerebras/zai-glm-4.7`
Cloudflare AI Gateway	`cloudflare-ai-gateway`	`CLOUDFLARE_AI_GATEWAY_API_KEY`	-
DeepInfra	`deepinfra`	`DEEPINFRA_API_KEY`	`deepinfra/deepseek-ai/DeepSeek-V3.2`
DeepSeek	`deepseek`	`DEEPSEEK_API_KEY`	`deepseek/deepseek-v4-flash`
GitHub Copilot	`github-copilot`	`COPILOT_GITHUB_TOKEN` / `GH_TOKEN` / `GITHUB_TOKEN`	-
Groq	`groq`	`GROQ_API_KEY`	-
Hugging Face Inference	`huggingface`	`HUGGINGFACE_HUB_TOKEN` or `HF_TOKEN`	`huggingface/deepseek-ai/DeepSeek-R1`
Kilo Gateway	`kilocode`	`KILOCODE_API_KEY`	`kilocode/kilo/auto`
Kimi Coding	`kimi`	`KIMI_API_KEY` or `KIMICODE_API_KEY`	`kimi/kimi-for-coding`
MiniMax	`minimax` / `minimax-portal`	`MINIMAX_API_KEY` / `MINIMAX_OAUTH_TOKEN`	`minimax/MiniMax-M2.7`
Mistral	`mistral`	`MISTRAL_API_KEY`	`mistral/mistral-large-latest`
Moonshot	`moonshot`	`MOONSHOT_API_KEY`	`moonshot/kimi-k2.6`
NVIDIA	`nvidia`	`NVIDIA_API_KEY`	`nvidia/nvidia/nemotron-3-super-120b-a12b`
OpenRouter	`openrouter`	`OPENROUTER_API_KEY`	`openrouter/auto`
Qianfan	`qianfan`	`QIANFAN_API_KEY`	`qianfan/deepseek-v3.2`
Qwen Cloud	`qwen`	`QWEN_API_KEY` / `MODELSTUDIO_API_KEY` / `DASHSCOPE_API_KEY`	`qwen/qwen3.5-plus`
StepFun	`stepfun` / `stepfun-plan`	`STEPFUN_API_KEY`	`stepfun/step-3.5-flash`
Together	`together`	`TOGETHER_API_KEY`	`together/moonshotai/Kimi-K2.5`
Venice	`venice`	`VENICE_API_KEY`	-
Vercel AI Gateway	`vercel-ai-gateway`	`AI_GATEWAY_API_KEY`	`vercel-ai-gateway/anthropic/claude-opus-4.6`
Volcano Engine (Doubao)	`volcengine` / `volcengine-plan`	`VOLCANO_ENGINE_API_KEY`	`volcengine-plan/ark-code-latest`
xAI	`xai`	`XAI_API_KEY`	`xai/grok-4.3`
Xiaomi	`xiaomi`	`XIAOMI_API_KEY`	`xiaomi/mimo-v2-flash`

Особливості, які варто знати

OpenRouter

Застосовує свої заголовки атрибуції застосунку та маркери Anthropic cache_control лише на перевірених маршрутах openrouter.ai. Посилання DeepSeek, Moonshot і ZAI придатні для cache-TTL у кешуванні підказок, керованому OpenRouter, але не отримують маркерів кешу Anthropic. Як проксі-подібний OpenAI-сумісний шлях, він пропускає формування, призначене лише для нативного OpenAI (serviceTier, Responses store, підказки кешу підказок, сумісність міркування OpenAI). Посилання на базі Gemini зберігають лише санітизацію сигнатур думок proxy-Gemini.

Kilo Gateway

Посилання на базі Gemini проходять тим самим шляхом санітизації proxy-Gemini; kilocode/kilo/auto та інші посилання, що не підтримують проксі-міркування, пропускають інʼєкцію проксі-міркування.

MiniMax

Налаштування з API-ключем записує явні текстові визначення чат-моделей M2.7; розуміння зображень залишається на медіапостачальнику MiniMax-VL-01, яким володіє плагін.

NVIDIA

ID моделей використовують простір імен nvidia/<vendor>/<model> (наприклад, nvidia/nvidia/nemotron-... поряд із nvidia/moonshotai/kimi-k2.5); засоби вибору зберігають буквальну композицію <provider>/<model-id>, тоді як канонічний ключ, надісланий до API, залишається з одним префіксом.

xAI

Використовує шлях xAI Responses. grok-4.3 є вбудованою стандартною чат-моделлю. /fast або params.fastMode: true переписує grok-3, grok-3-mini, grok-4 і grok-4-0709 на їхні варіанти *-fast. tool_stream увімкнено за замовчуванням; вимкніть через agents.defaults.models["xai/<model>"].params.tool_stream=false.

Cerebras

Постачається як вбудований плагін постачальника cerebras. GLM використовує zai-glm-4.7; OpenAI-сумісна базова URL-адреса: https://api.cerebras.ai/v1.

Постачальники через `models.providers` (власна/базова URL-адреса)

Використовуйте models.providers (або models.json), щоб додати власних постачальників або OpenAI/Anthropic-сумісні проксі.

Багато з наведених нижче вбудованих плагінів постачальників уже публікують стандартний каталог. Використовуйте явні записи models.providers.<id> лише тоді, коли потрібно перевизначити стандартну базову URL-адресу, заголовки або список моделей.

Перевірки можливостей моделей Gateway також читають явні метадані models.providers.<id>.models[]. Якщо власна або проксі-модель приймає зображення, задайте input: ["text", "image"] для цієї моделі, щоб WebChat і шляхи вкладень, що походять із вузла, передавали зображення як нативні вхідні дані моделі, а не як текстові медіапосилання.

agents.defaults.models["provider/model"] керує лише видимістю моделей, псевдонімами та метаданими окремих моделей для агентів. Він сам собою не реєструє нову runtime-модель. Для моделей власного постачальника також додайте models.providers.<provider>.models[] принаймні з відповідним id.

Moonshot AI (Kimi)

Moonshot постачається як вбудований плагін постачальника. За замовчуванням використовуйте вбудованого постачальника й додавайте явний запис models.providers.moonshot лише тоді, коли потрібно перевизначити базову URL-адресу або метадані моделі:

Постачальник: moonshot
Автентифікація: MOONSHOT_API_KEY
Приклад моделі: moonshot/kimi-k2.6
CLI: openclaw onboard --auth-choice moonshot-api-key or openclaw onboard --auth-choice moonshot-api-key-cn

ID моделей Kimi K2:

moonshot/kimi-k2.6
moonshot/kimi-k2.5
moonshot/kimi-k2-thinking
moonshot/kimi-k2-thinking-turbo
moonshot/kimi-k2-turbo

json5

{  agents: {    defaults: { model: { primary: "moonshot/kimi-k2.6" } },  },  models: {    mode: "merge",    providers: {      moonshot: {        baseUrl: "https://api.moonshot.ai/v1",        apiKey: "${MOONSHOT_API_KEY}",        api: "openai-completions",        models: [{ id: "kimi-k2.6", name: "Kimi K2.6" }],      },    },  },}

Kimi coding

Kimi Coding використовує сумісну з Anthropic кінцеву точку Moonshot AI:

Постачальник: kimi
Автентифікація: KIMI_API_KEY
Приклад моделі: kimi/kimi-for-coding

json5

{  env: { KIMI_API_KEY: "sk-..." },  agents: {    defaults: { model: { primary: "kimi/kimi-for-coding" } },  },}

Застарілі kimi/kimi-code і kimi/k2p5 досі приймаються як ідентифікатори моделей для сумісності й нормалізуються до стабільного ідентифікатора моделі API Kimi.

Volcano Engine (Doubao)

Volcano Engine (火山引擎) надає доступ до Doubao та інших моделей у Китаї.

Постачальник: volcengine (для кодування: volcengine-plan)
Автентифікація: VOLCANO_ENGINE_API_KEY
Приклад моделі: volcengine-plan/ark-code-latest
CLI: openclaw onboard --auth-choice volcengine-api-key

json5

{  agents: {    defaults: { model: { primary: "volcengine-plan/ark-code-latest" } },  },}

Під час онбордингу за замовчуванням використовується поверхня для кодування, але загальний каталог volcengine/* реєструється одночасно.

У засобах вибору моделей для онбордингу/налаштування варіант автентифікації Volcengine надає перевагу рядкам volcengine/* і volcengine-plan/*. Якщо ці моделі ще не завантажено, OpenClaw повертається до нефільтрованого каталогу замість показу порожнього засобу вибору, обмеженого постачальником.

Standard models

volcengine/doubao-seed-1-8-251228 (Doubao Seed 1.8)
volcengine/doubao-seed-code-preview-251028
volcengine/kimi-k2-5-260127 (Kimi K2.5)
volcengine/glm-4-7-251222 (GLM 4.7)
volcengine/deepseek-v3-2-251201 (DeepSeek V3.2 128K)

Coding models (volcengine-plan)

volcengine-plan/ark-code-latest
volcengine-plan/doubao-seed-code
volcengine-plan/kimi-k2.5
volcengine-plan/kimi-k2-thinking
volcengine-plan/glm-4.7

BytePlus (International)

BytePlus ARK надає міжнародним користувачам доступ до тих самих моделей, що й Volcano Engine.

Постачальник: byteplus (для кодування: byteplus-plan)
Автентифікація: BYTEPLUS_API_KEY
Приклад моделі: byteplus-plan/ark-code-latest
CLI: openclaw onboard --auth-choice byteplus-api-key

json5

{  agents: {    defaults: { model: { primary: "byteplus-plan/ark-code-latest" } },  },}

Під час онбордингу за замовчуванням використовується поверхня для кодування, але загальний каталог byteplus/* реєструється одночасно.

У засобах вибору моделей для онбордингу/налаштування варіант автентифікації BytePlus надає перевагу рядкам byteplus/* і byteplus-plan/*. Якщо ці моделі ще не завантажено, OpenClaw повертається до нефільтрованого каталогу замість показу порожнього засобу вибору, обмеженого постачальником.

Standard models

byteplus/seed-1-8-251228 (Seed 1.8)
byteplus/kimi-k2-5-260127 (Kimi K2.5)
byteplus/glm-4-7-251222 (GLM 4.7)

Coding models (byteplus-plan)

byteplus-plan/ark-code-latest
byteplus-plan/doubao-seed-code
byteplus-plan/kimi-k2.5
byteplus-plan/kimi-k2-thinking
byteplus-plan/glm-4.7

Synthetic

Synthetic надає сумісні з Anthropic моделі через постачальника synthetic:

Постачальник: synthetic
Автентифікація: SYNTHETIC_API_KEY
Приклад моделі: synthetic/hf:MiniMaxAI/MiniMax-M2.5
CLI: openclaw onboard --auth-choice synthetic-api-key

json5

{  agents: {    defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },  },  models: {    mode: "merge",    providers: {      synthetic: {        baseUrl: "https://api.synthetic.new/anthropic",        apiKey: "${SYNTHETIC_API_KEY}",        api: "anthropic-messages",        models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],      },    },  },}

MiniMax

MiniMax налаштовується через models.providers, оскільки використовує власні кінцеві точки:

MiniMax OAuth (глобально): --auth-choice minimax-global-oauth
MiniMax OAuth (CN): --auth-choice minimax-cn-oauth
API-ключ MiniMax (глобально): --auth-choice minimax-global-api
API-ключ MiniMax (CN): --auth-choice minimax-cn-api
Автентифікація: MINIMAX_API_KEY для minimax; MINIMAX_OAUTH_TOKEN або MINIMAX_API_KEY для minimax-portal

Див. /providers/minimax для подробиць налаштування, варіантів моделей і фрагментів конфігурації.

Розподіл можливостей, якими володіє Plugin:

Типові налаштування тексту/чату залишаються на minimax/MiniMax-M2.7
Генерація зображень — це minimax/image-01 або minimax-portal/image-01
Розуміння зображень належить Plugin: MiniMax-VL-01 на обох шляхах автентифікації MiniMax
Вебпошук залишається на ідентифікаторі постачальника minimax

LM Studio

LM Studio постачається як вбудований Plugin постачальника, що використовує нативний API:

Постачальник: lmstudio
Автентифікація: LM_API_TOKEN
Типова базова URL-адреса інференсу: http://localhost:1234/v1

Потім задайте модель (замініть на один з ідентифікаторів, які повертає http://localhost:1234/api/v1/models):

json5

{  agents: {    defaults: { model: { primary: "lmstudio/openai/gpt-oss-20b" } },  },}

OpenClaw використовує нативні /api/v1/models і /api/v1/models/load LM Studio для виявлення та автоматичного завантаження, а для інференсу за замовчуванням — /v1/chat/completions. Якщо ви хочете, щоб JIT-завантаження, TTL і автоматичне витіснення LM Studio керували життєвим циклом моделі, задайте models.providers.lmstudio.params.preload: false. Див. /providers/lmstudio для налаштування та усунення несправностей.

Ollama

Ollama постачається як вбудований Plugin постачальника й використовує нативний API Ollama:

Постачальник: ollama
Автентифікація: не потрібна (локальний сервер)
Приклад моделі: ollama/llama3.3
Встановлення: https://ollama.com/download

bash

# Install Ollama, then pull a model:ollama pull llama3.3

json5

{  agents: {    defaults: { model: { primary: "ollama/llama3.3" } },  },}

Ollama виявляється локально за адресою http://127.0.0.1:11434, коли ви вмикаєте її через OLLAMA_API_KEY, а вбудований Plugin постачальника додає Ollama безпосередньо до openclaw onboard і засобу вибору моделей. Див. /providers/ollama для онбордингу, хмарного/локального режиму та власної конфігурації.

vLLM

vLLM постачається як вбудований Plugin постачальника для локальних/самостійно розміщених сумісних з OpenAI серверів:

Постачальник: vllm
Автентифікація: необов’язкова (залежить від вашого сервера)
Типова базова URL-адреса: http://127.0.0.1:8000/v1

Щоб увімкнути локальне автоматичне виявлення (працює будь-яке значення, якщо ваш сервер не вимагає автентифікації):

bash

export VLLM_API_KEY="vllm-local"

Потім задайте модель (замініть на один з ідентифікаторів, які повертає /v1/models):

json5

{  agents: {    defaults: { model: { primary: "vllm/your-model-id" } },  },}

Див. /providers/vllm для подробиць.

SGLang

SGLang постачається як вбудований Plugin постачальника для швидких самостійно розміщених сумісних з OpenAI серверів:

Постачальник: sglang
Автентифікація: необов’язкова (залежить від вашого сервера)
Типова базова URL-адреса: http://127.0.0.1:30000/v1

bash

export SGLANG_API_KEY="sglang-local"

Потім задайте модель (замініть на один з ідентифікаторів, які повертає /v1/models):

json5

{  agents: {    defaults: { model: { primary: "sglang/your-model-id" } },  },}

Див. /providers/sglang для подробиць.

Локальні проксі (LM Studio, vLLM, LiteLLM тощо)

Приклад (сумісний з OpenAI):

json5

{  agents: {    defaults: {      model: { primary: "lmstudio/my-local-model" },      models: { "lmstudio/my-local-model": { alias: "Local" } },    },  },  models: {    providers: {      lmstudio: {        baseUrl: "http://localhost:1234/v1",        apiKey: "${LM_API_TOKEN}",        api: "openai-completions",        timeoutSeconds: 300,        models: [          {            id: "my-local-model",            name: "Local Model",            reasoning: false,            input: ["text"],            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },            contextWindow: 200000,            maxTokens: 8192,          },        ],      },    },  },}

Default optional fields

Для власних постачальників reasoning, input, cost, contextWindow і maxTokens є необов’язковими. Якщо їх пропущено, OpenClaw за замовчуванням використовує:

reasoning: false
input: ["text"]
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }
contextWindow: 200000
maxTokens: 8192

Рекомендовано: задайте явні значення, що відповідають обмеженням вашого проксі/моделі.

Proxy-route shaping rules

Для api: "openai-completions" на ненативних кінцевих точках (будь-яка непорожня baseUrl, хост якої не є api.openai.com) OpenClaw примусово встановлює compat.supportsDeveloperRole: false, щоб уникнути помилок постачальника 400 для непідтримуваних ролей developer.
Маршрути сумісних з OpenAI проксі також пропускають нативне формування запитів, специфічне лише для OpenAI: без service_tier, без Responses store, без Completions store, без підказок prompt-cache, без формування payload для сумісності reasoning OpenAI і без прихованих заголовків атрибуції OpenClaw.
Для сумісних з OpenAI проксі Completions, яким потрібні специфічні для постачальника поля, задайте agents.defaults.models["provider/model"].params.extra_body (або extraBody), щоб об’єднати додатковий JSON із вихідним тілом запиту.
Для елементів керування chat-template vLLM задайте agents.defaults.models["provider/model"].params.chat_template_kwargs. Вбудований Plugin vLLM автоматично надсилає enable_thinking: false і force_nonempty_content: true для vllm/nemotron-3-*, коли рівень thinking сеансу вимкнено.
Для повільних локальних моделей або віддалених LAN/tailnet-хостів задайте models.providers.<id>.timeoutSeconds. Це розширює обробку HTTP-запитів до моделей постачальника, включно з підключенням, заголовками, потоковою передачею тіла та загальним перериванням guarded-fetch, не збільшуючи загальний тайм-аут виконання агента.
HTTP-виклики постачальника моделей дозволяють fake-IP DNS-відповіді Surge, Clash і sing-box у 198.18.0.0/15 і fc00::/7 лише для налаштованого імені хоста baseUrl постачальника. Інші приватні, loopback, link-local і metadata-призначення все одно потребують явного ввімкнення models.providers.<id>.request.allowPrivateNetwork: true.
Якщо baseUrl порожній або пропущений, OpenClaw зберігає типову поведінку OpenAI (яка розв’язується до api.openai.com).
Для безпеки явне compat.supportsDeveloperRole: true усе одно перевизначається на ненативних кінцевих точках openai-completions.
Для api: "anthropic-messages" на непрямих кінцевих точках (будь-який постачальник, окрім канонічного anthropic, або власний models.providers.anthropic.baseUrl, хост якого не є публічною кінцевою точкою api.anthropic.com) OpenClaw приглушує неявні beta-заголовки Anthropic, такі як claude-code-20250219, interleaved-thinking-2025-05-14 і OAuth-маркери, щоб власні сумісні з Anthropic проксі не відхиляли непідтримувані beta-прапорці. Явно задайте models.providers.<id>.headers["anthropic-beta"], якщо вашому проксі потрібні конкретні beta-функції.

Приклади CLI

bash

openclaw onboard --auth-choice opencode-zenopenclaw models set opencode/claude-opus-4-6openclaw models list

Див. також: Конфігурація для повних прикладів конфігурації.

Пов’язане

Довідник конфігурації - ключі конфігурації моделей
Відмовостійкість моделей - fallback-ланцюги та поведінка повторних спроб
Моделі - конфігурація моделей і псевдоніми
Постачальники - посібники з налаштування для кожного постачальника

Was this useful?

Короткі правила

Поведінка постачальника, якою володіє Plugin

Ротація API-ключів

Вбудовані постачальники (каталог pi-ai)

OpenAI

Anthropic

OpenAI Codex OAuth

Інші розміщені варіанти в стилі підписки

OpenCode

Google Gemini (API-ключ)

Google Vertex і Gemini CLI

Установіть Gemini CLI

brew

npm

Увімкніть Plugin

Увійдіть

Налаштуйте проєкт (за потреби)

Z.AI (GLM)

Vercel AI Gateway

Kilo Gateway

Інші вбудовані Plugin провайдерів

Особливості, які варто знати

Постачальники через models.providers (власна/базова URL-адреса)

Moonshot AI (Kimi)

Kimi coding

Volcano Engine (Doubao)

Standard models

Coding models (volcengine-plan)

BytePlus (International)

Standard models

Coding models (byteplus-plan)

Synthetic

MiniMax

LM Studio

Ollama

vLLM

SGLang

Локальні проксі (LM Studio, vLLM, LiteLLM тощо)

Приклади CLI

Пов’язане

Постачальники через `models.providers` (власна/базова URL-адреса)