Providers

OpenAI

OpenAI fornece APIs de desenvolvedor para modelos GPT, e Codex também está disponível como um agente de codificação de plano ChatGPT por meio dos clientes Codex da OpenAI. O OpenClaw mantém essas superfícies separadas para que a configuração permaneça previsível.

O OpenClaw usa openai/* como a rota canônica de modelo da OpenAI. Turnos de agente incorporados em modelos OpenAI são executados pelo runtime nativo do servidor de app do Codex por padrão; a autenticação direta por chave de API da OpenAI permanece disponível para superfícies OpenAI sem agente, como imagens, embeddings, fala e tempo real.

Modelos de agente - modelos openai/* pelo runtime Codex; entre com autenticação Codex para uso de assinatura ChatGPT/Codex ou configure um backup de chave de API OpenAI compatível com Codex quando você quiser intencionalmente autenticação por chave de API.
APIs OpenAI sem agente - acesso direto à OpenAI Platform com cobrança baseada em uso por meio de OPENAI_API_KEY ou onboarding de chave de API da OpenAI.
Configuração legada - referências de modelo openai-codex/* são reparadas por openclaw doctor --fix para openai/* mais o runtime Codex.

A OpenAI oferece suporte explicitamente ao uso de OAuth de assinatura em ferramentas externas e fluxos de trabalho como o OpenClaw.

Provedor, modelo, runtime e canal são camadas separadas. Se esses rótulos estiverem sendo misturados, leia Runtimes de agente antes de alterar a configuração.

Escolha rápida

Objetivo	Use	Observações
Assinatura ChatGPT/Codex com runtime Codex nativo	`openai/gpt-5.5`	Configuração padrão de agente OpenAI. Entre com autenticação Codex.
Cobrança direta por chave de API para modelos de agente	`openai/gpt-5.5` mais um perfil de chave de API compatível com Codex	Use `auth.order.openai` para colocar o backup depois da autenticação de assinatura.
Cobrança direta por chave de API por PI explícito	`openai/gpt-5.5` mais runtime de provedor/modelo `pi`	Selecione um perfil normal de chave de API `openai`.
Alias mais recente da API ChatGPT Instant	`openai/chat-latest`	Somente chave de API direta. Alias móvel para experimentos, não o padrão.
Autenticação de assinatura ChatGPT/Codex por PI explícito	`openai/gpt-5.5` mais runtime de provedor/modelo `pi`	Selecione um perfil de autenticação `openai-codex` para a rota de compatibilidade.
Geração ou edição de imagens	`openai/gpt-image-2`	Funciona com `OPENAI_API_KEY` ou OAuth OpenAI Codex.
Imagens com fundo transparente	`openai/gpt-image-1.5`	Use `outputFormat=png` ou `webp` e `openai.background=transparent`.

Mapa de nomes

Os nomes são parecidos, mas não intercambiáveis:

Nome que você vê	Camada	Significado
`openai`	Prefixo do provedor	Rota canônica de modelo da OpenAI; turnos de agente usam o runtime Codex.
`openai-codex`	Prefixo legado de autenticação/perfil	Namespace mais antigo de perfil OAuth/assinatura OpenAI Codex. Perfis existentes e `auth.order.openai-codex` ainda funcionam.
Plugin `codex`	Plugin	Plugin integrado do OpenClaw que fornece runtime nativo do servidor de app do Codex e controles de chat `/codex`.
`agentRuntime.id: codex` de provedor/modelo	Runtime de agente	Força o harness nativo do servidor de app do Codex para turnos incorporados correspondentes.
`/codex ...`	Conjunto de comandos de chat	Vincule/controle threads do servidor de app do Codex a partir de uma conversa.
`runtime: "acp", agentId: "codex"`	Rota de sessão ACP	Caminho de fallback explícito que executa Codex por ACP/acpx.

Isso significa que uma configuração pode conter intencionalmente referências de modelo openai/* enquanto perfis de autenticação ainda apontam para credenciais compatíveis com Codex. Prefira auth.order.openai para novas configurações; perfis openai-codex:* existentes e auth.order.openai-codex continuam compatíveis. openclaw doctor --fix reescreve referências de modelo legadas openai-codex/* para a rota canônica de modelo da OpenAI.

Cobertura de recursos do OpenClaw

Capacidade OpenAI	Superfície OpenClaw	Status
Chat / Responses	provedor de modelo `openai/<model>`	Sim
Modelos de assinatura Codex	`openai/<model>` com OAuth `openai-codex`	Sim
Referências de modelo Codex legadas	`openai-codex/<model>`	Reparado pelo doctor para `openai/<model>`
Harness do servidor de app Codex	`openai/<model>` com runtime omitido ou `agentRuntime.id: codex` de provedor/modelo	Sim
Busca na web do lado do servidor	Ferramenta nativa OpenAI Responses	Sim, quando a busca na web está habilitada e nenhum provedor está fixado
Imagens	`image_generate`	Sim
Vídeos	`video_generate`	Sim
Texto para fala	`messages.tts.provider: "openai"` / `tts`	Sim
Fala para texto em lote	`tools.media.audio` / compreensão de mídia	Sim
Fala para texto em streaming	Voice Call `streaming.provider: "openai"`	Sim
Voz em tempo real	Voice Call `realtime.provider: "openai"` / Talk da Control UI	Sim
Embeddings	provedor de embeddings de memória	Sim

Embeddings de memória

O OpenClaw pode usar a OpenAI, ou um endpoint de embeddings compatível com OpenAI, para indexação memory_search e embeddings de consulta:

json5

{  agents: {    defaults: {      memorySearch: {        provider: "openai",        model: "text-embedding-3-small",      },    },  },}

Para endpoints compatíveis com OpenAI que exigem rótulos de embedding assimétricos, defina queryInputType e documentInputType em memorySearch. O OpenClaw os encaminha como campos de solicitação input_type específicos do provedor: embeddings de consulta usam queryInputType; fragmentos de memória indexados e indexação em lote usam documentInputType. Consulte a referência de configuração de memória para ver o exemplo completo.

Introdução

Escolha seu método de autenticação preferido e siga as etapas de configuração.

Chave de API (OpenAI Platform)

Melhor para: acesso direto à API e cobrança baseada em uso.

Obtenha sua chave de API

Crie ou copie uma chave de API no painel da OpenAI Platform.

Execute o onboarding

bash

openclaw onboard --auth-choice openai-api-key

Ou passe a chave diretamente:

bash

openclaw onboard --openai-api-key "$OPENAI_API_KEY"

Verifique se o modelo está disponível

bash

openclaw models list --provider openai

Resumo de rota

Referência de modelo	Configuração de runtime	Rota	Autenticação
`openai/gpt-5.5`	omitido / `agentRuntime.id: "codex"` de provedor/modelo	Harness do servidor de app Codex	Perfil OpenAI compatível com Codex
`openai/gpt-5.4-mini`	omitido / `agentRuntime.id: "codex"` de provedor/modelo	Harness do servidor de app Codex	Perfil OpenAI compatível com Codex
`openai/gpt-5.5`	`agentRuntime.id: "pi"` de provedor/modelo	Runtime incorporado PI	perfil `openai` ou perfil `openai-codex` selecionado

Exemplo de configuração

json5

{  env: { OPENAI_API_KEY: "sk-..." },  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}

Para testar o modelo Instant atual do ChatGPT pela API OpenAI, defina o modelo como openai/chat-latest:

json5

{  env: { OPENAI_API_KEY: "sk-..." },  agents: { defaults: { model: { primary: "openai/chat-latest" } } },}

chat-latest é um alias móvel. A OpenAI o documenta como o modelo Instant mais recente usado no ChatGPT e recomenda gpt-5.5 para uso de API em produção, então mantenha openai/gpt-5.5 como o padrão estável, a menos que você queira explicitamente esse comportamento de alias. Atualmente, o alias aceita apenas verbosidade de texto medium, então o OpenClaw normaliza substituições incompatíveis de verbosidade de texto da OpenAI para este modelo.

Assinatura do Codex

Ideal para: usar sua assinatura do ChatGPT/Codex com execução nativa do servidor de aplicativo do Codex em vez de uma chave de API separada. A nuvem do Codex exige login no ChatGPT.

Execute o OAuth do Codex

bash

openclaw onboard --auth-choice openai-codex

Ou execute o OAuth diretamente:

bash

openclaw models auth login --provider openai-codex

Para configurações sem interface ou hostis a callbacks, adicione --device-code para entrar com um fluxo de código de dispositivo do ChatGPT em vez do callback de navegador em localhost:

bash

openclaw models auth login --provider openai-codex --device-code

Use a rota canônica de modelo da OpenAI

bash

openclaw config set agents.defaults.model.primary openai/gpt-5.5

Nenhuma configuração de runtime é necessária para o caminho padrão. Turnos de agentes da OpenAI selecionam automaticamente o runtime nativo do servidor de aplicativo do Codex, e o OpenClaw instala ou repara o plugin Codex empacotado quando essa rota é escolhida.

Verifique se a autenticação do Codex está disponível

bash

openclaw models list --provider openai-codex

Depois que o gateway estiver em execução, envie /codex status ou /codex models no chat para verificar o runtime nativo do servidor de aplicativo.

Resumo da rota

Ref. do modelo	Configuração de runtime	Rota	Autenticação
`openai/gpt-5.5`	omitido / provider/model `agentRuntime.id: "codex"`	Harness nativo do servidor de aplicativo do Codex	Login do Codex ou perfil de autenticação `openai` ordenado
`openai/gpt-5.5`	provider/model `agentRuntime.id: "pi"`	Runtime incorporado do PI com transporte interno de autenticação do Codex	Perfil `openai-codex` selecionado
`openai-codex/gpt-5.5`	reparado pelo doctor	Rota legada reescrita para `openai/gpt-5.5`	Perfil `openai-codex` existente

Exemplo de configuração

json5

{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },}

Com uma chave de API de backup, mantenha o modelo em openai/gpt-5.5 e coloque a ordem de autenticação em openai. O OpenClaw tentará a assinatura primeiro e depois a chave de API, enquanto permanece no harness do Codex:

json5

{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },  auth: {    order: {      openai: [        "openai-codex:[email protected]",        "openai:api-key-backup",      ],    },  },}

Verificar e recuperar o roteamento OAuth do Codex

Use estes comandos para ver qual modelo, runtime e rota de autenticação seu agente padrão está usando:

bash

openclaw models statusopenclaw models auth list --provider openai-codexopenclaw config get agents.defaults.model --jsonopenclaw config get models.providers.openai.agentRuntime --json

Para um agente específico, adicione --agent <id>:

bash

openclaw models status --agent <id>openclaw models auth list --agent <id> --provider openai-codex

Se uma configuração mais antiga ainda tiver openai-codex/gpt-* ou um pin de sessão OpenAI PI obsoleto sem configuração explícita de runtime, repare-a:

bash

openclaw doctor --fixopenclaw config validate

Se models auth list --provider openai-codex não mostrar nenhum perfil utilizável, entre novamente:

bash

openclaw models auth login --provider openai-codexopenclaw models status --probe --probe-provider openai-codex

openai/* é a rota de modelo para turnos de agentes da OpenAI pelo Codex. O id de provedor de autenticação/perfil openai-codex continua aceito para perfis existentes e listagem pela CLI.

Indicador de status

O chat /status mostra qual runtime de modelo está ativo para a sessão atual. O harness do servidor de aplicativo do Codex empacotado aparece como Runtime: OpenAI Codex para turnos de modelo de agentes da OpenAI. Pins de sessão PI obsoletos são reparados para Codex, a menos que a configuração fixe explicitamente o PI.

Aviso do doctor

Se rotas openai-codex/* ou pins OpenAI PI obsoletos permanecerem na configuração ou no estado da sessão, openclaw doctor --fix os reescreve para openai/* com o runtime do Codex, a menos que o PI esteja explicitamente configurado.

Limite da janela de contexto

O OpenClaw trata metadados de modelo e o limite de contexto do runtime como valores separados.

Para openai/gpt-5.5 pelo catálogo OAuth do Codex:

contextWindow nativo: 1000000
Limite padrão de runtime contextTokens: 272000

Na prática, o limite padrão menor tem características melhores de latência e qualidade. Substitua-o com contextTokens:

json5

{  models: {    providers: {      "openai-codex": {        models: [{ id: "gpt-5.5", contextTokens: 160000 }],      },    },  },}

Recuperação do catálogo

O OpenClaw usa metadados do catálogo upstream do Codex para gpt-5.5 quando eles estão presentes. Se a descoberta ao vivo do Codex omitir a linha gpt-5.5 enquanto a conta estiver autenticada, o OpenClaw sintetiza essa linha de modelo OAuth para que execuções de cron, subagente e modelo padrão configurado não falhem com Unknown model.

Autenticação nativa do servidor de aplicativo do Codex

O harness nativo do servidor de aplicativo do Codex usa refs de modelo openai/* mais configuração de runtime omitida ou provider/model agentRuntime.id: "codex", mas sua autenticação ainda é baseada em conta. O OpenClaw seleciona a autenticação nesta ordem:

Perfis de autenticação OpenAI ordenados para o agente, de preferência em auth.order.openai. Perfis openai-codex:* existentes e auth.order.openai-codex continuam válidos para instalações mais antigas.
A conta existente do servidor de aplicativo, como um login local do ChatGPT pela CLI do Codex.
Somente para inicializações locais do servidor de aplicativo stdio, CODEX_API_KEY e depois OPENAI_API_KEY, quando o servidor de aplicativo não relata nenhuma conta e ainda exige autenticação OpenAI.

Isso significa que um login local de assinatura ChatGPT/Codex não é substituído apenas porque o processo do gateway também tem OPENAI_API_KEY para modelos OpenAI diretos ou embeddings. O fallback de chave de API por variável de ambiente é apenas o caminho local stdio sem conta; ele não é enviado a conexões WebSocket do servidor de aplicativo. Quando um perfil de Codex no estilo assinatura é selecionado, o OpenClaw também mantém CODEX_API_KEY e OPENAI_API_KEY fora do processo filho stdio do servidor de aplicativo gerado e envia as credenciais selecionadas pela RPC de login do servidor de aplicativo. Quando esse perfil de assinatura é bloqueado por um limite de uso do Codex, o OpenClaw pode alternar para o próximo perfil de chave de API openai:* ordenado sem mudar o modelo selecionado nem sair do harness do Codex. Depois que o tempo de redefinição da assinatura passa, o perfil de assinatura fica elegível novamente.

Geração de imagens

O plugin openai empacotado registra geração de imagens pela ferramenta image_generate. Ele oferece suporte tanto à geração de imagens com chave de API OpenAI quanto à geração de imagens com OAuth do Codex pela mesma ref. de modelo openai/gpt-image-2.

Recurso	Chave de API OpenAI	OAuth do Codex
Ref. do modelo	`openai/gpt-image-2`	`openai/gpt-image-2`
Autenticação	`OPENAI_API_KEY`	Login OAuth do OpenAI Codex
Transporte	API OpenAI Images	Backend Codex Responses
Máximo de imagens por solicitação	4	4
Modo de edição	Habilitado (até 5 imagens de referência)	Habilitado (até 5 imagens de referência)
Substituições de tamanho	Compatíveis, incluindo tamanhos 2K/4K	Compatíveis, incluindo tamanhos 2K/4K
Proporção / resolução	Não encaminhado para a API OpenAI Images	Mapeado para um tamanho compatível quando seguro

json5

{  agents: {    defaults: {      imageGenerationModel: { primary: "openai/gpt-image-2" },    },  },}

gpt-image-2 é o padrão tanto para geração de texto para imagem da OpenAI quanto para edição de imagens. gpt-image-1.5, gpt-image-1 e gpt-image-1-mini continuam utilizáveis como substituições explícitas de modelo. Use openai/gpt-image-1.5 para saída PNG/WebP com fundo transparente; a API atual de gpt-image-2 rejeita background: "transparent".

Para uma solicitação de fundo transparente, agentes devem chamar image_generate com model: "openai/gpt-image-1.5", outputFormat: "png" ou "webp" e background: "transparent"; a opção de provedor antiga openai.background ainda é aceita. O OpenClaw também protege as rotas públicas OpenAI e OpenAI Codex OAuth reescrevendo solicitações transparentes padrão openai/gpt-image-2 para gpt-image-1.5; endpoints Azure e OpenAI-compatíveis personalizados mantêm seus nomes de implantação/modelo configurados.

A mesma configuração é exposta para execuções CLI sem interface:

bash

openclaw infer image generate \  --model openai/gpt-image-1.5 \  --output-format png \  --background transparent \  --prompt "A simple red circle sticker on a transparent background" \  --json

Use as mesmas flags --output-format e --background com openclaw infer image edit ao começar a partir de um arquivo de entrada. --openai-background permanece disponível como um alias específico da OpenAI.

Para instalações com OAuth do Codex, mantenha a mesma ref. openai/gpt-image-2. Quando um perfil OAuth openai-codex estiver configurado, o OpenClaw resolve esse token de acesso OAuth armazenado e envia solicitações de imagem pelo backend Codex Responses. Ele não tenta primeiro OPENAI_API_KEY nem faz fallback silencioso para uma chave de API para essa solicitação. Configure models.providers.openai explicitamente com uma chave de API, URL base personalizada ou endpoint Azure quando quiser a rota direta da API OpenAI Images. Se esse endpoint de imagem personalizado estiver em uma LAN/endereço privado confiável, também defina browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; o OpenClaw mantém endpoints de imagem OpenAI-compatíveis privados/internos bloqueados, a menos que essa adesão explícita esteja presente.

Gerar:

Code

/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1

Gerar um PNG transparente:

Code

/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent

Editar:

Code

/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

Geração de vídeo

O Plugin openai incluído registra geração de vídeo por meio da ferramenta video_generate.

Recurso	Valor
Modelo padrão	`openai/sora-2`
Modos	Texto para vídeo, imagem para vídeo, edição de vídeo único
Entradas de referência	1 imagem ou 1 vídeo
Substituições de tamanho	Compatíveis
Outras substituições	`aspectRatio`, `resolution`, `audio`, `watermark` são ignorados com um aviso da ferramenta

json5

{  agents: {    defaults: {      videoGenerationModel: { primary: "openai/sora-2" },    },  },}

Contribuição de prompt do GPT-5

O OpenClaw adiciona uma contribuição compartilhada de prompt do GPT-5 para execuções da família GPT-5 entre provedores. Ela se aplica pelo id do modelo, portanto openai/gpt-5.5, refs legadas anteriores ao reparo como openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 e outras refs compatíveis com GPT-5 recebem a mesma sobreposição. Modelos GPT-4.x mais antigos não recebem.

O harness Codex nativo incluído usa o mesmo comportamento do GPT-5 e a mesma sobreposição de Heartbeat por meio das instruções de desenvolvedor do servidor de aplicativo Codex, portanto sessões openai/gpt-5.x roteadas pelo Codex mantêm a mesma orientação de acompanhamento e Heartbeat proativo, embora o Codex seja dono do restante do prompt do harness.

A contribuição do GPT-5 adiciona um contrato de comportamento marcado para persistência de persona, segurança de execução, disciplina de ferramentas, formato de saída, verificações de conclusão e verificação. O comportamento de resposta específico do canal e de mensagem silenciosa permanece no prompt de sistema compartilhado do OpenClaw e na política de entrega de saída. A orientação do GPT-5 está sempre habilitada para modelos correspondentes. A camada de estilo de interação amigável é separada e configurável.

Valor	Efeito
`"friendly"` (padrão)	Habilitar a camada de estilo de interação amigável
`"on"`	Alias para `"friendly"`
`"off"`	Desabilitar apenas a camada de estilo amigável

Configuração

json5

{  agents: {    defaults: {      promptOverlays: {        gpt5: { personality: "friendly" },      },    },  },}

CLI

bash

openclaw config set agents.defaults.promptOverlays.gpt5.personality off

Voz e fala

Síntese de fala (TTS)

O Plugin openai incluído registra síntese de fala para a superfície messages.tts.

Configuração	Caminho de configuração	Padrão
Modelo	`messages.tts.providers.openai.model`	`gpt-4o-mini-tts`
Voz	`messages.tts.providers.openai.voice`	`coral`
Velocidade	`messages.tts.providers.openai.speed`	(não definido)
Instruções	`messages.tts.providers.openai.instructions`	(não definido, somente `gpt-4o-mini-tts`)
Formato	`messages.tts.providers.openai.responseFormat`	`opus` para notas de voz, `mp3` para arquivos
Chave de API	`messages.tts.providers.openai.apiKey`	Recorre a `OPENAI_API_KEY`
URL base	`messages.tts.providers.openai.baseUrl`	`https://api.openai.com/v1`
Corpo extra	`messages.tts.providers.openai.extraBody` / `extra_body`	(não definido)

Modelos disponíveis: gpt-4o-mini-tts, tts-1, tts-1-hd. Vozes disponíveis: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.

extraBody é mesclado ao JSON da solicitação /audio/speech após os campos gerados pelo OpenClaw, portanto use-o para endpoints compatíveis com OpenAI que exigem chaves adicionais, como lang. Chaves de protótipo são ignoradas.

json5

{  messages: {    tts: {      providers: {        openai: { model: "gpt-4o-mini-tts", voice: "coral" },      },    },  },}

Fala para texto

O Plugin openai incluído registra fala para texto em lote por meio da superfície de transcrição de entendimento de mídia do OpenClaw.

Modelo padrão: gpt-4o-transcribe
Endpoint: REST OpenAI /v1/audio/transcriptions
Caminho de entrada: upload de arquivo de áudio multipart
Compatível com o OpenClaw sempre que a transcrição de áudio de entrada usa tools.media.audio, incluindo segmentos de canal de voz do Discord e anexos de áudio de canal

Para forçar a OpenAI para transcrição de áudio de entrada:

json5

{  tools: {    media: {      audio: {        models: [          {            type: "provider",            provider: "openai",            model: "gpt-4o-transcribe",          },        ],      },    },  },}

Dicas de idioma e prompt são encaminhadas para a OpenAI quando fornecidas pela configuração compartilhada de mídia de áudio ou pela solicitação de transcrição por chamada.

Transcrição em tempo real

O Plugin openai incluído registra transcrição em tempo real para o Plugin Voice Call.

Configuração	Caminho de configuração	Padrão
Modelo	`plugins.entries.voice-call.config.streaming.providers.openai.model`	`gpt-4o-transcribe`
Idioma	`...openai.language`	(não definido)
Prompt	`...openai.prompt`	(não definido)
Duração do silêncio	`...openai.silenceDurationMs`	`800`
Limite de VAD	`...openai.vadThreshold`	`0.5`
Autenticação	`...openai.apiKey`, `OPENAI_API_KEY` ou OAuth `openai-codex`	Chaves de API se conectam diretamente; OAuth emite um segredo de cliente de transcrição Realtime

Voz em tempo real

O Plugin openai incluído registra voz em tempo real para o Plugin Voice Call.

Configuração	Caminho de configuração	Padrão
Modelo	`plugins.entries.voice-call.config.realtime.providers.openai.model`	`gpt-realtime-2`
Voz	`...openai.voice`	`alloy`
Temperatura (ponte de implantação do Azure)	`...openai.temperature`	`0.8`
Limite de VAD	`...openai.vadThreshold`	`0.5`
Duração do silêncio	`...openai.silenceDurationMs`	`500`
Preenchimento de prefixo	`...openai.prefixPaddingMs`	`300`
Esforço de raciocínio	`...openai.reasoningEffort`	(não definido)
Autenticação	`...openai.apiKey`, `OPENAI_API_KEY` ou OAuth `openai-codex`	O Talk no navegador e pontes de backend que não sejam Azure podem usar OAuth do Codex

Vozes Realtime integradas disponíveis para gpt-realtime-2: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. A OpenAI recomenda marin e cedar para a melhor qualidade Realtime. Este é um conjunto separado das vozes de texto para fala acima; não presuma que uma voz de TTS como fable, nova ou onyx seja válida para sessões Realtime.

Endpoints do Azure OpenAI

O provedor openai incluído pode apontar para um recurso do Azure OpenAI para geração de imagens substituindo a URL base. No caminho de geração de imagens, o OpenClaw detecta nomes de host do Azure em models.providers.openai.baseUrl e muda para o formato de solicitação do Azure automaticamente.

Use o Azure OpenAI quando:

Você já tem uma assinatura, cota ou contrato empresarial do Azure OpenAI
Você precisa de residência regional de dados ou controles de conformidade fornecidos pelo Azure
Você quer manter o tráfego dentro de uma locação existente do Azure

Configuração

Para geração de imagens do Azure por meio do provedor openai incluído, aponte models.providers.openai.baseUrl para o seu recurso do Azure e defina apiKey como a chave do Azure OpenAI (não uma chave da OpenAI Platform):

json5

{  models: {    providers: {      openai: {        baseUrl: "https://<your-resource>.openai.azure.com",        apiKey: "<azure-openai-api-key>",      },    },  },}

O OpenClaw reconhece estes sufixos de host do Azure para a rota de geração de imagens do Azure:

*.openai.azure.com
*.services.ai.azure.com
*.cognitiveservices.azure.com

Para solicitações de geração de imagens em um host do Azure reconhecido, o OpenClaw:

Envia o cabeçalho api-key em vez de Authorization: Bearer
Usa caminhos com escopo de implantação (/openai/deployments/{deployment}/...)
Anexa ?api-version=... a cada solicitação
Usa um tempo limite de solicitação padrão de 600s para chamadas de geração de imagens do Azure. Valores timeoutMs por chamada ainda substituem esse padrão.

Outras URLs base (OpenAI pública, proxies compatíveis com OpenAI) mantêm o formato padrão de solicitação de imagem da OpenAI.

Versão da API

Defina AZURE_OPENAI_API_VERSION para fixar uma versão específica de preview ou GA do Azure para o caminho de geração de imagens do Azure:

bash

export AZURE_OPENAI_API_VERSION="2024-12-01-preview"

O padrão é 2024-12-01-preview quando a variável não está definida.

Nomes de modelos são nomes de implantação

O Azure OpenAI vincula modelos a implantações. Para solicitações de geração de imagens do Azure roteadas pelo provedor openai incluído, o campo model no OpenClaw deve ser o nome da implantação do Azure que você configurou no portal do Azure, não o ID público do modelo da OpenAI.

Se você criar uma implantação chamada gpt-image-2-prod que serve gpt-image-2:

Code

/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1

A mesma regra de nome de implantação se aplica às chamadas de geração de imagens roteadas pelo provedor openai incluído.

Disponibilidade regional

A geração de imagens do Azure está disponível atualmente apenas em um subconjunto de regiões (por exemplo, eastus2, swedencentral, polandcentral, westus3, uaenorth). Verifique a lista atual de regiões da Microsoft antes de criar uma implantação e confirme se o modelo específico é oferecido na sua região.

Diferenças de parâmetros

O Azure OpenAI e a OpenAI pública nem sempre aceitam os mesmos parâmetros de imagem. O Azure pode rejeitar opções que a OpenAI pública permite (por exemplo, certos valores de background em gpt-image-2) ou expô-las apenas em versões específicas de modelo. Essas diferenças vêm do Azure e do modelo subjacente, não do OpenClaw. Se uma solicitação do Azure falhar com um erro de validação, verifique o conjunto de parâmetros compatível com sua implantação específica e versão da API no portal do Azure.

Configuração avançada

Transporte (WebSocket vs SSE)

O OpenClaw usa WebSocket primeiro com fallback para SSE ("auto") para openai/*.

No modo "auto", o OpenClaw:

Tenta novamente uma falha inicial de WebSocket antes de fazer fallback para SSE
Após uma falha, marca o WebSocket como degradado por ~60 segundos e usa SSE durante o período de resfriamento
Anexa cabeçalhos estáveis de identidade de sessão e turno para novas tentativas e reconexões
Normaliza contadores de uso (input_tokens / prompt_tokens) entre variantes de transporte

Valor	Comportamento
`"auto"` (padrão)	WebSocket primeiro, fallback para SSE
`"sse"`	Forçar apenas SSE
`"websocket"`	Forçar apenas WebSocket

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: { transport: "auto" },        },      },    },  },}

Documentação relacionada da OpenAI:

Modo rápido

O OpenClaw expõe um alternador compartilhado de modo rápido para openai/*:

Chat/UI: /fast status|on|off
Configuração: agents.defaults.models["<provider>/<model>"].params.fastMode

Quando ativado, o OpenClaw mapeia o modo rápido para o processamento prioritário da OpenAI (service_tier = "priority"). Valores existentes de service_tier são preservados, e o modo rápido não reescreve reasoning nem text.verbosity.

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": { params: { fastMode: true } },      },    },  },}

Processamento prioritário (service_tier)

A API da OpenAI expõe processamento prioritário por meio de service_tier. Defina-o por modelo no OpenClaw:

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": { params: { serviceTier: "priority" } },      },    },  },}

Valores compatíveis: auto, default, flex, priority.

Compaction no lado do servidor (Responses API)

Para modelos OpenAI Responses diretos (openai/* em api.openai.com), o wrapper de stream do harness Pi do Plugin OpenAI ativa automaticamente a compactação no lado do servidor:

Força store: true (a menos que a compatibilidade do modelo defina supportsStore: false)
Injeta context_management: [{ type: "compaction", compact_threshold: ... }]
compact_threshold padrão: 70% de contextWindow (ou 80000 quando indisponível)

Isso se aplica ao caminho integrado do harness Pi e aos hooks do provedor OpenAI usados por execuções incorporadas. O harness nativo do servidor de apps Codex gerencia seu próprio contexto por meio do Codex e é configurado pela rota padrão de agente da OpenAI ou pela política de runtime de provedor/modelo.

Ativar explicitamente

Útil para endpoints compatíveis, como Azure OpenAI Responses:

json5

{  agents: {    defaults: {      models: {        "azure-openai-responses/gpt-5.5": {          params: { responsesServerCompaction: true },        },      },    },  },}

Limite personalizado

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: {            responsesServerCompaction: true,            responsesCompactThreshold: 120000,          },        },      },    },  },}

Desativar

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: { responsesServerCompaction: false },        },      },    },  },}

Modo GPT estritamente agêntico

Para execuções da família GPT-5 em openai/*, o OpenClaw pode usar um contrato de execução incorporado mais estrito:

json5

{  agents: {    defaults: {      embeddedPi: { executionContract: "strict-agentic" },    },  },}

Com strict-agentic, o OpenClaw:

Não trata mais um turno apenas com plano como progresso bem-sucedido quando uma ação de ferramenta está disponível
Tenta novamente o turno com uma orientação para agir agora
Ativa automaticamente update_plan para trabalhos substanciais
Expõe um estado bloqueado explícito se o modelo continuar planejando sem agir

Rotas nativas vs. compatíveis com OpenAI

O OpenClaw trata endpoints diretos da OpenAI, Codex e Azure OpenAI de forma diferente de proxies /v1 genéricos compatíveis com OpenAI:

Rotas nativas (openai/*, Azure OpenAI):

Mantêm reasoning: { effort: "none" } apenas para modelos compatíveis com o esforço none da OpenAI
Omitem raciocínio desativado para modelos ou proxies que rejeitam reasoning.effort: "none"
Definem esquemas de ferramentas como modo estrito por padrão
Anexam cabeçalhos ocultos de atribuição apenas em hosts nativos verificados
Mantêm formatação de solicitação exclusiva da OpenAI (service_tier, store, compatibilidade de raciocínio, dicas de cache de prompt)

Rotas proxy/compatíveis:

Usam comportamento de compatibilidade mais flexível
Removem store de Completions de payloads openai-completions não nativos
Aceitam JSON avançado de passagem direta params.extra_body/params.extraBody para proxies Completions compatíveis com OpenAI
Aceitam params.chat_template_kwargs para proxies Completions compatíveis com OpenAI, como vLLM
Não forçam esquemas de ferramentas estritos nem cabeçalhos exclusivos de rotas nativas

O Azure OpenAI usa transporte nativo e comportamento compatível, mas não recebe os cabeçalhos ocultos de atribuição.

Relacionado

Seleção de modelo

Escolha de provedores, referências de modelo e comportamento de failover.

Geração de imagens

Parâmetros compartilhados da ferramenta de imagem e seleção de provedor.

Geração de vídeo

Parâmetros compartilhados da ferramenta de vídeo e seleção de provedor.

OAuth e autenticação

Detalhes de autenticação e regras de reutilização de credenciais.

Was this useful?