Providers

OpenAI

OpenAI fornece APIs de desenvolvedor para modelos GPT, e Codex também está disponível como um agente de codificação de plano ChatGPT por meio dos clientes Codex da OpenAI. O OpenClaw mantém essas superfícies separadas para que a configuração permaneça previsível.

O OpenClaw usa openai/* como a rota canônica de modelo da OpenAI. Turnos de agente incorporados em modelos OpenAI são executados pelo runtime nativo do servidor de app do Codex por padrão; a autenticação direta por chave de API da OpenAI permanece disponível para superfícies OpenAI sem agente, como imagens, embeddings, fala e tempo real.

  • Modelos de agente - modelos openai/* pelo runtime Codex; entre com autenticação Codex para uso de assinatura ChatGPT/Codex ou configure um backup de chave de API OpenAI compatível com Codex quando você quiser intencionalmente autenticação por chave de API.
  • APIs OpenAI sem agente - acesso direto à OpenAI Platform com cobrança baseada em uso por meio de OPENAI_API_KEY ou onboarding de chave de API da OpenAI.
  • Configuração legada - referências de modelo openai-codex/* são reparadas por openclaw doctor --fix para openai/* mais o runtime Codex.

A OpenAI oferece suporte explicitamente ao uso de OAuth de assinatura em ferramentas externas e fluxos de trabalho como o OpenClaw.

Provedor, modelo, runtime e canal são camadas separadas. Se esses rótulos estiverem sendo misturados, leia Runtimes de agente antes de alterar a configuração.

Escolha rápida

Objetivo Use Observações
Assinatura ChatGPT/Codex com runtime Codex nativo openai/gpt-5.5 Configuração padrão de agente OpenAI. Entre com autenticação Codex.
Cobrança direta por chave de API para modelos de agente openai/gpt-5.5 mais um perfil de chave de API compatível com Codex Use auth.order.openai para colocar o backup depois da autenticação de assinatura.
Cobrança direta por chave de API por PI explícito openai/gpt-5.5 mais runtime de provedor/modelo pi Selecione um perfil normal de chave de API openai.
Alias mais recente da API ChatGPT Instant openai/chat-latest Somente chave de API direta. Alias móvel para experimentos, não o padrão.
Autenticação de assinatura ChatGPT/Codex por PI explícito openai/gpt-5.5 mais runtime de provedor/modelo pi Selecione um perfil de autenticação openai-codex para a rota de compatibilidade.
Geração ou edição de imagens openai/gpt-image-2 Funciona com OPENAI_API_KEY ou OAuth OpenAI Codex.
Imagens com fundo transparente openai/gpt-image-1.5 Use outputFormat=png ou webp e openai.background=transparent.

Mapa de nomes

Os nomes são parecidos, mas não intercambiáveis:

Nome que você vê Camada Significado
openai Prefixo do provedor Rota canônica de modelo da OpenAI; turnos de agente usam o runtime Codex.
openai-codex Prefixo legado de autenticação/perfil Namespace mais antigo de perfil OAuth/assinatura OpenAI Codex. Perfis existentes e auth.order.openai-codex ainda funcionam.
Plugin codex Plugin Plugin integrado do OpenClaw que fornece runtime nativo do servidor de app do Codex e controles de chat /codex.
agentRuntime.id: codex de provedor/modelo Runtime de agente Força o harness nativo do servidor de app do Codex para turnos incorporados correspondentes.
/codex ... Conjunto de comandos de chat Vincule/controle threads do servidor de app do Codex a partir de uma conversa.
runtime: "acp", agentId: "codex" Rota de sessão ACP Caminho de fallback explícito que executa Codex por ACP/acpx.

Isso significa que uma configuração pode conter intencionalmente referências de modelo openai/* enquanto perfis de autenticação ainda apontam para credenciais compatíveis com Codex. Prefira auth.order.openai para novas configurações; perfis openai-codex:* existentes e auth.order.openai-codex continuam compatíveis. openclaw doctor --fix reescreve referências de modelo legadas openai-codex/* para a rota canônica de modelo da OpenAI.

Cobertura de recursos do OpenClaw

Capacidade OpenAI Superfície OpenClaw Status
Chat / Responses provedor de modelo openai/<model> Sim
Modelos de assinatura Codex openai/<model> com OAuth openai-codex Sim
Referências de modelo Codex legadas openai-codex/<model> Reparado pelo doctor para openai/<model>
Harness do servidor de app Codex openai/<model> com runtime omitido ou agentRuntime.id: codex de provedor/modelo Sim
Busca na web do lado do servidor Ferramenta nativa OpenAI Responses Sim, quando a busca na web está habilitada e nenhum provedor está fixado
Imagens image_generate Sim
Vídeos video_generate Sim
Texto para fala messages.tts.provider: "openai" / tts Sim
Fala para texto em lote tools.media.audio / compreensão de mídia Sim
Fala para texto em streaming Voice Call streaming.provider: "openai" Sim
Voz em tempo real Voice Call realtime.provider: "openai" / Talk da Control UI Sim
Embeddings provedor de embeddings de memória Sim

Embeddings de memória

O OpenClaw pode usar a OpenAI, ou um endpoint de embeddings compatível com OpenAI, para indexação memory_search e embeddings de consulta:

json5
{  agents: {    defaults: {      memorySearch: {        provider: "openai",        model: "text-embedding-3-small",      },    },  },}

Para endpoints compatíveis com OpenAI que exigem rótulos de embedding assimétricos, defina queryInputType e documentInputType em memorySearch. O OpenClaw os encaminha como campos de solicitação input_type específicos do provedor: embeddings de consulta usam queryInputType; fragmentos de memória indexados e indexação em lote usam documentInputType. Consulte a referência de configuração de memória para ver o exemplo completo.

Introdução

Escolha seu método de autenticação preferido e siga as etapas de configuração.

Chave de API (OpenAI Platform)

Melhor para: acesso direto à API e cobrança baseada em uso.

  • Obtenha sua chave de API

    Crie ou copie uma chave de API no painel da OpenAI Platform.

  • Execute o onboarding

    bash
    openclaw onboard --auth-choice openai-api-key

    Ou passe a chave diretamente:

    bash
    openclaw onboard --openai-api-key "$OPENAI_API_KEY"
  • Verifique se o modelo está disponível

    bash
    openclaw models list --provider openai
  • Resumo de rota

    Referência de modelo Configuração de runtime Rota Autenticação
    openai/gpt-5.5 omitido / agentRuntime.id: "codex" de provedor/modelo Harness do servidor de app Codex Perfil OpenAI compatível com Codex
    openai/gpt-5.4-mini omitido / agentRuntime.id: "codex" de provedor/modelo Harness do servidor de app Codex Perfil OpenAI compatível com Codex
    openai/gpt-5.5 agentRuntime.id: "pi" de provedor/modelo Runtime incorporado PI perfil openai ou perfil openai-codex selecionado

    Exemplo de configuração

    json5
    {  env: { OPENAI_API_KEY: "sk-..." },  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}

    Para testar o modelo Instant atual do ChatGPT pela API OpenAI, defina o modelo como openai/chat-latest:

    json5
    {  env: { OPENAI_API_KEY: "sk-..." },  agents: { defaults: { model: { primary: "openai/chat-latest" } } },}

    chat-latest é um alias móvel. A OpenAI o documenta como o modelo Instant mais recente usado no ChatGPT e recomenda gpt-5.5 para uso de API em produção, então mantenha openai/gpt-5.5 como o padrão estável, a menos que você queira explicitamente esse comportamento de alias. Atualmente, o alias aceita apenas verbosidade de texto medium, então o OpenClaw normaliza substituições incompatíveis de verbosidade de texto da OpenAI para este modelo.

    Assinatura do Codex

    Ideal para: usar sua assinatura do ChatGPT/Codex com execução nativa do servidor de aplicativo do Codex em vez de uma chave de API separada. A nuvem do Codex exige login no ChatGPT.

  • Execute o OAuth do Codex

    bash
    openclaw onboard --auth-choice openai-codex

    Ou execute o OAuth diretamente:

    bash
    openclaw models auth login --provider openai-codex

    Para configurações sem interface ou hostis a callbacks, adicione --device-code para entrar com um fluxo de código de dispositivo do ChatGPT em vez do callback de navegador em localhost:

    bash
    openclaw models auth login --provider openai-codex --device-code
  • Use a rota canônica de modelo da OpenAI

    bash
    openclaw config set agents.defaults.model.primary openai/gpt-5.5

    Nenhuma configuração de runtime é necessária para o caminho padrão. Turnos de agentes da OpenAI selecionam automaticamente o runtime nativo do servidor de aplicativo do Codex, e o OpenClaw instala ou repara o plugin Codex empacotado quando essa rota é escolhida.

  • Verifique se a autenticação do Codex está disponível

    bash
    openclaw models list --provider openai-codex

    Depois que o gateway estiver em execução, envie /codex status ou /codex models no chat para verificar o runtime nativo do servidor de aplicativo.

  • Resumo da rota

    Ref. do modelo Configuração de runtime Rota Autenticação
    openai/gpt-5.5 omitido / provider/model agentRuntime.id: "codex" Harness nativo do servidor de aplicativo do Codex Login do Codex ou perfil de autenticação openai ordenado
    openai/gpt-5.5 provider/model agentRuntime.id: "pi" Runtime incorporado do PI com transporte interno de autenticação do Codex Perfil openai-codex selecionado
    openai-codex/gpt-5.5 reparado pelo doctor Rota legada reescrita para openai/gpt-5.5 Perfil openai-codex existente

    Exemplo de configuração

    json5
    {  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },}

    Com uma chave de API de backup, mantenha o modelo em openai/gpt-5.5 e coloque a ordem de autenticação em openai. O OpenClaw tentará a assinatura primeiro e depois a chave de API, enquanto permanece no harness do Codex:

    json5
    {  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },  auth: {    order: {      openai: [        "openai-codex:[email protected]",        "openai:api-key-backup",      ],    },  },}

    Verificar e recuperar o roteamento OAuth do Codex

    Use estes comandos para ver qual modelo, runtime e rota de autenticação seu agente padrão está usando:

    bash
    openclaw models statusopenclaw models auth list --provider openai-codexopenclaw config get agents.defaults.model --jsonopenclaw config get models.providers.openai.agentRuntime --json

    Para um agente específico, adicione --agent <id>:

    bash
    openclaw models status --agent <id>openclaw models auth list --agent <id> --provider openai-codex

    Se uma configuração mais antiga ainda tiver openai-codex/gpt-* ou um pin de sessão OpenAI PI obsoleto sem configuração explícita de runtime, repare-a:

    bash
    openclaw doctor --fixopenclaw config validate

    Se models auth list --provider openai-codex não mostrar nenhum perfil utilizável, entre novamente:

    bash
    openclaw models auth login --provider openai-codexopenclaw models status --probe --probe-provider openai-codex

    openai/* é a rota de modelo para turnos de agentes da OpenAI pelo Codex. O id de provedor de autenticação/perfil openai-codex continua aceito para perfis existentes e listagem pela CLI.

    Indicador de status

    O chat /status mostra qual runtime de modelo está ativo para a sessão atual. O harness do servidor de aplicativo do Codex empacotado aparece como Runtime: OpenAI Codex para turnos de modelo de agentes da OpenAI. Pins de sessão PI obsoletos são reparados para Codex, a menos que a configuração fixe explicitamente o PI.

    Aviso do doctor

    Se rotas openai-codex/* ou pins OpenAI PI obsoletos permanecerem na configuração ou no estado da sessão, openclaw doctor --fix os reescreve para openai/* com o runtime do Codex, a menos que o PI esteja explicitamente configurado.

    Limite da janela de contexto

    O OpenClaw trata metadados de modelo e o limite de contexto do runtime como valores separados.

    Para openai/gpt-5.5 pelo catálogo OAuth do Codex:

    • contextWindow nativo: 1000000
    • Limite padrão de runtime contextTokens: 272000

    Na prática, o limite padrão menor tem características melhores de latência e qualidade. Substitua-o com contextTokens:

    json5
    {  models: {    providers: {      "openai-codex": {        models: [{ id: "gpt-5.5", contextTokens: 160000 }],      },    },  },}

    O OpenClaw usa metadados do catálogo upstream do Codex para gpt-5.5 quando eles estão presentes. Se a descoberta ao vivo do Codex omitir a linha gpt-5.5 enquanto a conta estiver autenticada, o OpenClaw sintetiza essa linha de modelo OAuth para que execuções de cron, subagente e modelo padrão configurado não falhem com Unknown model.

    Autenticação nativa do servidor de aplicativo do Codex

    O harness nativo do servidor de aplicativo do Codex usa refs de modelo openai/* mais configuração de runtime omitida ou provider/model agentRuntime.id: "codex", mas sua autenticação ainda é baseada em conta. O OpenClaw seleciona a autenticação nesta ordem:

    1. Perfis de autenticação OpenAI ordenados para o agente, de preferência em auth.order.openai. Perfis openai-codex:* existentes e auth.order.openai-codex continuam válidos para instalações mais antigas.
    2. A conta existente do servidor de aplicativo, como um login local do ChatGPT pela CLI do Codex.
    3. Somente para inicializações locais do servidor de aplicativo stdio, CODEX_API_KEY e depois OPENAI_API_KEY, quando o servidor de aplicativo não relata nenhuma conta e ainda exige autenticação OpenAI.

    Isso significa que um login local de assinatura ChatGPT/Codex não é substituído apenas porque o processo do gateway também tem OPENAI_API_KEY para modelos OpenAI diretos ou embeddings. O fallback de chave de API por variável de ambiente é apenas o caminho local stdio sem conta; ele não é enviado a conexões WebSocket do servidor de aplicativo. Quando um perfil de Codex no estilo assinatura é selecionado, o OpenClaw também mantém CODEX_API_KEY e OPENAI_API_KEY fora do processo filho stdio do servidor de aplicativo gerado e envia as credenciais selecionadas pela RPC de login do servidor de aplicativo. Quando esse perfil de assinatura é bloqueado por um limite de uso do Codex, o OpenClaw pode alternar para o próximo perfil de chave de API openai:* ordenado sem mudar o modelo selecionado nem sair do harness do Codex. Depois que o tempo de redefinição da assinatura passa, o perfil de assinatura fica elegível novamente.

    Geração de imagens

    O plugin openai empacotado registra geração de imagens pela ferramenta image_generate. Ele oferece suporte tanto à geração de imagens com chave de API OpenAI quanto à geração de imagens com OAuth do Codex pela mesma ref. de modelo openai/gpt-image-2.

    Recurso Chave de API OpenAI OAuth do Codex
    Ref. do modelo openai/gpt-image-2 openai/gpt-image-2
    Autenticação OPENAI_API_KEY Login OAuth do OpenAI Codex
    Transporte API OpenAI Images Backend Codex Responses
    Máximo de imagens por solicitação 4 4
    Modo de edição Habilitado (até 5 imagens de referência) Habilitado (até 5 imagens de referência)
    Substituições de tamanho Compatíveis, incluindo tamanhos 2K/4K Compatíveis, incluindo tamanhos 2K/4K
    Proporção / resolução Não encaminhado para a API OpenAI Images Mapeado para um tamanho compatível quando seguro
    json5
    {  agents: {    defaults: {      imageGenerationModel: { primary: "openai/gpt-image-2" },    },  },}

    gpt-image-2 é o padrão tanto para geração de texto para imagem da OpenAI quanto para edição de imagens. gpt-image-1.5, gpt-image-1 e gpt-image-1-mini continuam utilizáveis como substituições explícitas de modelo. Use openai/gpt-image-1.5 para saída PNG/WebP com fundo transparente; a API atual de gpt-image-2 rejeita background: "transparent".

    Para uma solicitação de fundo transparente, agentes devem chamar image_generate com model: "openai/gpt-image-1.5", outputFormat: "png" ou "webp" e background: "transparent"; a opção de provedor antiga openai.background ainda é aceita. O OpenClaw também protege as rotas públicas OpenAI e OpenAI Codex OAuth reescrevendo solicitações transparentes padrão openai/gpt-image-2 para gpt-image-1.5; endpoints Azure e OpenAI-compatíveis personalizados mantêm seus nomes de implantação/modelo configurados.

    A mesma configuração é exposta para execuções CLI sem interface:

    bash
    openclaw infer image generate \  --model openai/gpt-image-1.5 \  --output-format png \  --background transparent \  --prompt "A simple red circle sticker on a transparent background" \  --json

    Use as mesmas flags --output-format e --background com openclaw infer image edit ao começar a partir de um arquivo de entrada. --openai-background permanece disponível como um alias específico da OpenAI.

    Para instalações com OAuth do Codex, mantenha a mesma ref. openai/gpt-image-2. Quando um perfil OAuth openai-codex estiver configurado, o OpenClaw resolve esse token de acesso OAuth armazenado e envia solicitações de imagem pelo backend Codex Responses. Ele não tenta primeiro OPENAI_API_KEY nem faz fallback silencioso para uma chave de API para essa solicitação. Configure models.providers.openai explicitamente com uma chave de API, URL base personalizada ou endpoint Azure quando quiser a rota direta da API OpenAI Images. Se esse endpoint de imagem personalizado estiver em uma LAN/endereço privado confiável, também defina browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; o OpenClaw mantém endpoints de imagem OpenAI-compatíveis privados/internos bloqueados, a menos que essa adesão explícita esteja presente.

    Gerar:

    Code
    /tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1

    Gerar um PNG transparente:

    Code
    /tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent

    Editar:

    Code
    /tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

    Geração de vídeo

    O Plugin openai incluído registra geração de vídeo por meio da ferramenta video_generate.

    Recurso Valor
    Modelo padrão openai/sora-2
    Modos Texto para vídeo, imagem para vídeo, edição de vídeo único
    Entradas de referência 1 imagem ou 1 vídeo
    Substituições de tamanho Compatíveis
    Outras substituições aspectRatio, resolution, audio, watermark são ignorados com um aviso da ferramenta
    json5
    {  agents: {    defaults: {      videoGenerationModel: { primary: "openai/sora-2" },    },  },}

    Contribuição de prompt do GPT-5

    O OpenClaw adiciona uma contribuição compartilhada de prompt do GPT-5 para execuções da família GPT-5 entre provedores. Ela se aplica pelo id do modelo, portanto openai/gpt-5.5, refs legadas anteriores ao reparo como openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 e outras refs compatíveis com GPT-5 recebem a mesma sobreposição. Modelos GPT-4.x mais antigos não recebem.

    O harness Codex nativo incluído usa o mesmo comportamento do GPT-5 e a mesma sobreposição de Heartbeat por meio das instruções de desenvolvedor do servidor de aplicativo Codex, portanto sessões openai/gpt-5.x roteadas pelo Codex mantêm a mesma orientação de acompanhamento e Heartbeat proativo, embora o Codex seja dono do restante do prompt do harness.

    A contribuição do GPT-5 adiciona um contrato de comportamento marcado para persistência de persona, segurança de execução, disciplina de ferramentas, formato de saída, verificações de conclusão e verificação. O comportamento de resposta específico do canal e de mensagem silenciosa permanece no prompt de sistema compartilhado do OpenClaw e na política de entrega de saída. A orientação do GPT-5 está sempre habilitada para modelos correspondentes. A camada de estilo de interação amigável é separada e configurável.

    Valor Efeito
    "friendly" (padrão) Habilitar a camada de estilo de interação amigável
    "on" Alias para "friendly"
    "off" Desabilitar apenas a camada de estilo amigável

    Configuração

    json5
    {  agents: {    defaults: {      promptOverlays: {        gpt5: { personality: "friendly" },      },    },  },}

    CLI

    bash
    openclaw config set agents.defaults.promptOverlays.gpt5.personality off

    Voz e fala

    Síntese de fala (TTS)

    O Plugin openai incluído registra síntese de fala para a superfície messages.tts.

    Configuração Caminho de configuração Padrão
    Modelo messages.tts.providers.openai.model gpt-4o-mini-tts
    Voz messages.tts.providers.openai.voice coral
    Velocidade messages.tts.providers.openai.speed (não definido)
    Instruções messages.tts.providers.openai.instructions (não definido, somente gpt-4o-mini-tts)
    Formato messages.tts.providers.openai.responseFormat opus para notas de voz, mp3 para arquivos
    Chave de API messages.tts.providers.openai.apiKey Recorre a OPENAI_API_KEY
    URL base messages.tts.providers.openai.baseUrl https://api.openai.com/v1
    Corpo extra messages.tts.providers.openai.extraBody / extra_body (não definido)

    Modelos disponíveis: gpt-4o-mini-tts, tts-1, tts-1-hd. Vozes disponíveis: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.

    extraBody é mesclado ao JSON da solicitação /audio/speech após os campos gerados pelo OpenClaw, portanto use-o para endpoints compatíveis com OpenAI que exigem chaves adicionais, como lang. Chaves de protótipo são ignoradas.

    json5
    {  messages: {    tts: {      providers: {        openai: { model: "gpt-4o-mini-tts", voice: "coral" },      },    },  },}
    Fala para texto

    O Plugin openai incluído registra fala para texto em lote por meio da superfície de transcrição de entendimento de mídia do OpenClaw.

    • Modelo padrão: gpt-4o-transcribe
    • Endpoint: REST OpenAI /v1/audio/transcriptions
    • Caminho de entrada: upload de arquivo de áudio multipart
    • Compatível com o OpenClaw sempre que a transcrição de áudio de entrada usa tools.media.audio, incluindo segmentos de canal de voz do Discord e anexos de áudio de canal

    Para forçar a OpenAI para transcrição de áudio de entrada:

    json5
    {  tools: {    media: {      audio: {        models: [          {            type: "provider",            provider: "openai",            model: "gpt-4o-transcribe",          },        ],      },    },  },}

    Dicas de idioma e prompt são encaminhadas para a OpenAI quando fornecidas pela configuração compartilhada de mídia de áudio ou pela solicitação de transcrição por chamada.

    Transcrição em tempo real

    O Plugin openai incluído registra transcrição em tempo real para o Plugin Voice Call.

    Configuração Caminho de configuração Padrão
    Modelo plugins.entries.voice-call.config.streaming.providers.openai.model gpt-4o-transcribe
    Idioma ...openai.language (não definido)
    Prompt ...openai.prompt (não definido)
    Duração do silêncio ...openai.silenceDurationMs 800
    Limite de VAD ...openai.vadThreshold 0.5
    Autenticação ...openai.apiKey, OPENAI_API_KEY ou OAuth openai-codex Chaves de API se conectam diretamente; OAuth emite um segredo de cliente de transcrição Realtime
    Voz em tempo real

    O Plugin openai incluído registra voz em tempo real para o Plugin Voice Call.

    Configuração Caminho de configuração Padrão
    Modelo plugins.entries.voice-call.config.realtime.providers.openai.model gpt-realtime-2
    Voz ...openai.voice alloy
    Temperatura (ponte de implantação do Azure) ...openai.temperature 0.8
    Limite de VAD ...openai.vadThreshold 0.5
    Duração do silêncio ...openai.silenceDurationMs 500
    Preenchimento de prefixo ...openai.prefixPaddingMs 300
    Esforço de raciocínio ...openai.reasoningEffort (não definido)
    Autenticação ...openai.apiKey, OPENAI_API_KEY ou OAuth openai-codex O Talk no navegador e pontes de backend que não sejam Azure podem usar OAuth do Codex

    Vozes Realtime integradas disponíveis para gpt-realtime-2: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. A OpenAI recomenda marin e cedar para a melhor qualidade Realtime. Este é um conjunto separado das vozes de texto para fala acima; não presuma que uma voz de TTS como fable, nova ou onyx seja válida para sessões Realtime.

    Endpoints do Azure OpenAI

    O provedor openai incluído pode apontar para um recurso do Azure OpenAI para geração de imagens substituindo a URL base. No caminho de geração de imagens, o OpenClaw detecta nomes de host do Azure em models.providers.openai.baseUrl e muda para o formato de solicitação do Azure automaticamente.

    Use o Azure OpenAI quando:

    • Você já tem uma assinatura, cota ou contrato empresarial do Azure OpenAI
    • Você precisa de residência regional de dados ou controles de conformidade fornecidos pelo Azure
    • Você quer manter o tráfego dentro de uma locação existente do Azure

    Configuração

    Para geração de imagens do Azure por meio do provedor openai incluído, aponte models.providers.openai.baseUrl para o seu recurso do Azure e defina apiKey como a chave do Azure OpenAI (não uma chave da OpenAI Platform):

    json5
    {  models: {    providers: {      openai: {        baseUrl: "https://<your-resource>.openai.azure.com",        apiKey: "<azure-openai-api-key>",      },    },  },}

    O OpenClaw reconhece estes sufixos de host do Azure para a rota de geração de imagens do Azure:

    • *.openai.azure.com
    • *.services.ai.azure.com
    • *.cognitiveservices.azure.com

    Para solicitações de geração de imagens em um host do Azure reconhecido, o OpenClaw:

    • Envia o cabeçalho api-key em vez de Authorization: Bearer
    • Usa caminhos com escopo de implantação (/openai/deployments/{deployment}/...)
    • Anexa ?api-version=... a cada solicitação
    • Usa um tempo limite de solicitação padrão de 600s para chamadas de geração de imagens do Azure. Valores timeoutMs por chamada ainda substituem esse padrão.

    Outras URLs base (OpenAI pública, proxies compatíveis com OpenAI) mantêm o formato padrão de solicitação de imagem da OpenAI.

    Versão da API

    Defina AZURE_OPENAI_API_VERSION para fixar uma versão específica de preview ou GA do Azure para o caminho de geração de imagens do Azure:

    bash
    export AZURE_OPENAI_API_VERSION="2024-12-01-preview"

    O padrão é 2024-12-01-preview quando a variável não está definida.

    Nomes de modelos são nomes de implantação

    O Azure OpenAI vincula modelos a implantações. Para solicitações de geração de imagens do Azure roteadas pelo provedor openai incluído, o campo model no OpenClaw deve ser o nome da implantação do Azure que você configurou no portal do Azure, não o ID público do modelo da OpenAI.

    Se você criar uma implantação chamada gpt-image-2-prod que serve gpt-image-2:

    Code
    /tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1

    A mesma regra de nome de implantação se aplica às chamadas de geração de imagens roteadas pelo provedor openai incluído.

    Disponibilidade regional

    A geração de imagens do Azure está disponível atualmente apenas em um subconjunto de regiões (por exemplo, eastus2, swedencentral, polandcentral, westus3, uaenorth). Verifique a lista atual de regiões da Microsoft antes de criar uma implantação e confirme se o modelo específico é oferecido na sua região.

    Diferenças de parâmetros

    O Azure OpenAI e a OpenAI pública nem sempre aceitam os mesmos parâmetros de imagem. O Azure pode rejeitar opções que a OpenAI pública permite (por exemplo, certos valores de background em gpt-image-2) ou expô-las apenas em versões específicas de modelo. Essas diferenças vêm do Azure e do modelo subjacente, não do OpenClaw. Se uma solicitação do Azure falhar com um erro de validação, verifique o conjunto de parâmetros compatível com sua implantação específica e versão da API no portal do Azure.

    Configuração avançada

    Transporte (WebSocket vs SSE)

    O OpenClaw usa WebSocket primeiro com fallback para SSE ("auto") para openai/*.

    No modo "auto", o OpenClaw:

    • Tenta novamente uma falha inicial de WebSocket antes de fazer fallback para SSE
    • Após uma falha, marca o WebSocket como degradado por ~60 segundos e usa SSE durante o período de resfriamento
    • Anexa cabeçalhos estáveis de identidade de sessão e turno para novas tentativas e reconexões
    • Normaliza contadores de uso (input_tokens / prompt_tokens) entre variantes de transporte
    Valor Comportamento
    "auto" (padrão) WebSocket primeiro, fallback para SSE
    "sse" Forçar apenas SSE
    "websocket" Forçar apenas WebSocket
    json5
    {  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: { transport: "auto" },        },      },    },  },}

    Documentação relacionada da OpenAI:

    Modo rápido

    O OpenClaw expõe um alternador compartilhado de modo rápido para openai/*:

    • Chat/UI: /fast status|on|off
    • Configuração: agents.defaults.models["<provider>/<model>"].params.fastMode

    Quando ativado, o OpenClaw mapeia o modo rápido para o processamento prioritário da OpenAI (service_tier = "priority"). Valores existentes de service_tier são preservados, e o modo rápido não reescreve reasoning nem text.verbosity.

    json5
    {  agents: {    defaults: {      models: {        "openai/gpt-5.5": { params: { fastMode: true } },      },    },  },}
    Processamento prioritário (service_tier)

    A API da OpenAI expõe processamento prioritário por meio de service_tier. Defina-o por modelo no OpenClaw:

    json5
    {  agents: {    defaults: {      models: {        "openai/gpt-5.5": { params: { serviceTier: "priority" } },      },    },  },}

    Valores compatíveis: auto, default, flex, priority.

    Compaction no lado do servidor (Responses API)

    Para modelos OpenAI Responses diretos (openai/* em api.openai.com), o wrapper de stream do harness Pi do Plugin OpenAI ativa automaticamente a compactação no lado do servidor:

    • Força store: true (a menos que a compatibilidade do modelo defina supportsStore: false)
    • Injeta context_management: [{ type: "compaction", compact_threshold: ... }]
    • compact_threshold padrão: 70% de contextWindow (ou 80000 quando indisponível)

    Isso se aplica ao caminho integrado do harness Pi e aos hooks do provedor OpenAI usados por execuções incorporadas. O harness nativo do servidor de apps Codex gerencia seu próprio contexto por meio do Codex e é configurado pela rota padrão de agente da OpenAI ou pela política de runtime de provedor/modelo.

    Ativar explicitamente

    Útil para endpoints compatíveis, como Azure OpenAI Responses:

    json5
    {  agents: {    defaults: {      models: {        "azure-openai-responses/gpt-5.5": {          params: { responsesServerCompaction: true },        },      },    },  },}

    Limite personalizado

    json5
    {  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: {            responsesServerCompaction: true,            responsesCompactThreshold: 120000,          },        },      },    },  },}

    Desativar

    json5
    {  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: { responsesServerCompaction: false },        },      },    },  },}
    Modo GPT estritamente agêntico

    Para execuções da família GPT-5 em openai/*, o OpenClaw pode usar um contrato de execução incorporado mais estrito:

    json5
    {  agents: {    defaults: {      embeddedPi: { executionContract: "strict-agentic" },    },  },}

    Com strict-agentic, o OpenClaw:

    • Não trata mais um turno apenas com plano como progresso bem-sucedido quando uma ação de ferramenta está disponível
    • Tenta novamente o turno com uma orientação para agir agora
    • Ativa automaticamente update_plan para trabalhos substanciais
    • Expõe um estado bloqueado explícito se o modelo continuar planejando sem agir
    Rotas nativas vs. compatíveis com OpenAI

    O OpenClaw trata endpoints diretos da OpenAI, Codex e Azure OpenAI de forma diferente de proxies /v1 genéricos compatíveis com OpenAI:

    Rotas nativas (openai/*, Azure OpenAI):

    • Mantêm reasoning: { effort: "none" } apenas para modelos compatíveis com o esforço none da OpenAI
    • Omitem raciocínio desativado para modelos ou proxies que rejeitam reasoning.effort: "none"
    • Definem esquemas de ferramentas como modo estrito por padrão
    • Anexam cabeçalhos ocultos de atribuição apenas em hosts nativos verificados
    • Mantêm formatação de solicitação exclusiva da OpenAI (service_tier, store, compatibilidade de raciocínio, dicas de cache de prompt)

    Rotas proxy/compatíveis:

    • Usam comportamento de compatibilidade mais flexível
    • Removem store de Completions de payloads openai-completions não nativos
    • Aceitam JSON avançado de passagem direta params.extra_body/params.extraBody para proxies Completions compatíveis com OpenAI
    • Aceitam params.chat_template_kwargs para proxies Completions compatíveis com OpenAI, como vLLM
    • Não forçam esquemas de ferramentas estritos nem cabeçalhos exclusivos de rotas nativas

    O Azure OpenAI usa transporte nativo e comportamento compatível, mas não recebe os cabeçalhos ocultos de atribuição.

    Relacionado

    Was this useful?