Providers
OpenAI
OpenAI fornece APIs de desenvolvedor para modelos GPT, e Codex também está disponível como um agente de codificação de plano ChatGPT por meio dos clientes Codex da OpenAI. O OpenClaw mantém essas superfícies separadas para que a configuração permaneça previsível.
O OpenClaw usa openai/* como a rota canônica de modelo da OpenAI. Turnos de agente incorporados em modelos OpenAI são executados pelo runtime nativo do servidor de app do Codex por padrão; a autenticação direta por chave de API da OpenAI permanece disponível para superfícies OpenAI sem agente, como imagens, embeddings, fala e tempo real.
- Modelos de agente - modelos
openai/*pelo runtime Codex; entre com autenticação Codex para uso de assinatura ChatGPT/Codex ou configure um backup de chave de API OpenAI compatível com Codex quando você quiser intencionalmente autenticação por chave de API. - APIs OpenAI sem agente - acesso direto à OpenAI Platform com cobrança baseada em uso por meio de
OPENAI_API_KEYou onboarding de chave de API da OpenAI. - Configuração legada - referências de modelo
openai-codex/*são reparadas poropenclaw doctor --fixparaopenai/*mais o runtime Codex.
A OpenAI oferece suporte explicitamente ao uso de OAuth de assinatura em ferramentas externas e fluxos de trabalho como o OpenClaw.
Provedor, modelo, runtime e canal são camadas separadas. Se esses rótulos estiverem sendo misturados, leia Runtimes de agente antes de alterar a configuração.
Escolha rápida
| Objetivo | Use | Observações |
|---|---|---|
| Assinatura ChatGPT/Codex com runtime Codex nativo | openai/gpt-5.5 |
Configuração padrão de agente OpenAI. Entre com autenticação Codex. |
| Cobrança direta por chave de API para modelos de agente | openai/gpt-5.5 mais um perfil de chave de API compatível com Codex |
Use auth.order.openai para colocar o backup depois da autenticação de assinatura. |
| Cobrança direta por chave de API por PI explícito | openai/gpt-5.5 mais runtime de provedor/modelo pi |
Selecione um perfil normal de chave de API openai. |
| Alias mais recente da API ChatGPT Instant | openai/chat-latest |
Somente chave de API direta. Alias móvel para experimentos, não o padrão. |
| Autenticação de assinatura ChatGPT/Codex por PI explícito | openai/gpt-5.5 mais runtime de provedor/modelo pi |
Selecione um perfil de autenticação openai-codex para a rota de compatibilidade. |
| Geração ou edição de imagens | openai/gpt-image-2 |
Funciona com OPENAI_API_KEY ou OAuth OpenAI Codex. |
| Imagens com fundo transparente | openai/gpt-image-1.5 |
Use outputFormat=png ou webp e openai.background=transparent. |
Mapa de nomes
Os nomes são parecidos, mas não intercambiáveis:
| Nome que você vê | Camada | Significado |
|---|---|---|
openai |
Prefixo do provedor | Rota canônica de modelo da OpenAI; turnos de agente usam o runtime Codex. |
openai-codex |
Prefixo legado de autenticação/perfil | Namespace mais antigo de perfil OAuth/assinatura OpenAI Codex. Perfis existentes e auth.order.openai-codex ainda funcionam. |
Plugin codex |
Plugin | Plugin integrado do OpenClaw que fornece runtime nativo do servidor de app do Codex e controles de chat /codex. |
agentRuntime.id: codex de provedor/modelo |
Runtime de agente | Força o harness nativo do servidor de app do Codex para turnos incorporados correspondentes. |
/codex ... |
Conjunto de comandos de chat | Vincule/controle threads do servidor de app do Codex a partir de uma conversa. |
runtime: "acp", agentId: "codex" |
Rota de sessão ACP | Caminho de fallback explícito que executa Codex por ACP/acpx. |
Isso significa que uma configuração pode conter intencionalmente referências de modelo openai/* enquanto perfis de autenticação ainda apontam para credenciais compatíveis com Codex. Prefira auth.order.openai para novas configurações; perfis openai-codex:* existentes e auth.order.openai-codex continuam compatíveis. openclaw doctor --fix reescreve referências de modelo legadas openai-codex/* para a rota canônica de modelo da OpenAI.
Cobertura de recursos do OpenClaw
| Capacidade OpenAI | Superfície OpenClaw | Status |
|---|---|---|
| Chat / Responses | provedor de modelo openai/<model> |
Sim |
| Modelos de assinatura Codex | openai/<model> com OAuth openai-codex |
Sim |
| Referências de modelo Codex legadas | openai-codex/<model> |
Reparado pelo doctor para openai/<model> |
| Harness do servidor de app Codex | openai/<model> com runtime omitido ou agentRuntime.id: codex de provedor/modelo |
Sim |
| Busca na web do lado do servidor | Ferramenta nativa OpenAI Responses | Sim, quando a busca na web está habilitada e nenhum provedor está fixado |
| Imagens | image_generate |
Sim |
| Vídeos | video_generate |
Sim |
| Texto para fala | messages.tts.provider: "openai" / tts |
Sim |
| Fala para texto em lote | tools.media.audio / compreensão de mídia |
Sim |
| Fala para texto em streaming | Voice Call streaming.provider: "openai" |
Sim |
| Voz em tempo real | Voice Call realtime.provider: "openai" / Talk da Control UI |
Sim |
| Embeddings | provedor de embeddings de memória | Sim |
Embeddings de memória
O OpenClaw pode usar a OpenAI, ou um endpoint de embeddings compatível com OpenAI, para indexação memory_search e embeddings de consulta:
{ agents: { defaults: { memorySearch: { provider: "openai", model: "text-embedding-3-small", }, }, },}Para endpoints compatíveis com OpenAI que exigem rótulos de embedding assimétricos, defina queryInputType e documentInputType em memorySearch. O OpenClaw os encaminha como campos de solicitação input_type específicos do provedor: embeddings de consulta usam queryInputType; fragmentos de memória indexados e indexação em lote usam documentInputType. Consulte a referência de configuração de memória para ver o exemplo completo.
Introdução
Escolha seu método de autenticação preferido e siga as etapas de configuração.
Chave de API (OpenAI Platform)
Melhor para: acesso direto à API e cobrança baseada em uso.
Obtenha sua chave de API
Crie ou copie uma chave de API no painel da OpenAI Platform.
Execute o onboarding
openclaw onboard --auth-choice openai-api-keyOu passe a chave diretamente:
openclaw onboard --openai-api-key "$OPENAI_API_KEY"Verifique se o modelo está disponível
openclaw models list --provider openaiResumo de rota
| Referência de modelo | Configuração de runtime | Rota | Autenticação |
|---|---|---|---|
openai/gpt-5.5 |
omitido / agentRuntime.id: "codex" de provedor/modelo |
Harness do servidor de app Codex | Perfil OpenAI compatível com Codex |
openai/gpt-5.4-mini |
omitido / agentRuntime.id: "codex" de provedor/modelo |
Harness do servidor de app Codex | Perfil OpenAI compatível com Codex |
openai/gpt-5.5 |
agentRuntime.id: "pi" de provedor/modelo |
Runtime incorporado PI | perfil openai ou perfil openai-codex selecionado |
Exemplo de configuração
{ env: { OPENAI_API_KEY: "sk-..." }, agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}Para testar o modelo Instant atual do ChatGPT pela API OpenAI, defina o modelo como openai/chat-latest:
{ env: { OPENAI_API_KEY: "sk-..." }, agents: { defaults: { model: { primary: "openai/chat-latest" } } },}chat-latest é um alias móvel. A OpenAI o documenta como o modelo Instant mais recente usado no ChatGPT e recomenda gpt-5.5 para uso de API em produção, então mantenha openai/gpt-5.5 como o padrão estável, a menos que você queira explicitamente esse comportamento de alias. Atualmente, o alias aceita apenas verbosidade de texto medium, então o OpenClaw normaliza substituições incompatíveis de verbosidade de texto da OpenAI para este modelo.
Assinatura do Codex
Ideal para: usar sua assinatura do ChatGPT/Codex com execução nativa do servidor de aplicativo do Codex em vez de uma chave de API separada. A nuvem do Codex exige login no ChatGPT.
Execute o OAuth do Codex
openclaw onboard --auth-choice openai-codexOu execute o OAuth diretamente:
openclaw models auth login --provider openai-codexPara configurações sem interface ou hostis a callbacks, adicione --device-code para entrar com um fluxo de código de dispositivo do ChatGPT em vez do callback de navegador em localhost:
openclaw models auth login --provider openai-codex --device-codeUse a rota canônica de modelo da OpenAI
openclaw config set agents.defaults.model.primary openai/gpt-5.5Nenhuma configuração de runtime é necessária para o caminho padrão. Turnos de agentes da OpenAI selecionam automaticamente o runtime nativo do servidor de aplicativo do Codex, e o OpenClaw instala ou repara o plugin Codex empacotado quando essa rota é escolhida.
Verifique se a autenticação do Codex está disponível
openclaw models list --provider openai-codexDepois que o gateway estiver em execução, envie /codex status ou /codex models
no chat para verificar o runtime nativo do servidor de aplicativo.
Resumo da rota
| Ref. do modelo | Configuração de runtime | Rota | Autenticação |
|---|---|---|---|
openai/gpt-5.5 |
omitido / provider/model agentRuntime.id: "codex" |
Harness nativo do servidor de aplicativo do Codex | Login do Codex ou perfil de autenticação openai ordenado |
openai/gpt-5.5 |
provider/model agentRuntime.id: "pi" |
Runtime incorporado do PI com transporte interno de autenticação do Codex | Perfil openai-codex selecionado |
openai-codex/gpt-5.5 |
reparado pelo doctor | Rota legada reescrita para openai/gpt-5.5 |
Perfil openai-codex existente |
Exemplo de configuração
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, },}Com uma chave de API de backup, mantenha o modelo em openai/gpt-5.5 e coloque a
ordem de autenticação em openai. O OpenClaw tentará a assinatura primeiro e depois
a chave de API, enquanto permanece no harness do Codex:
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, }, auth: { order: { openai: [ "openai-codex:[email protected]", "openai:api-key-backup", ], }, },}Verificar e recuperar o roteamento OAuth do Codex
Use estes comandos para ver qual modelo, runtime e rota de autenticação seu agente padrão está usando:
openclaw models statusopenclaw models auth list --provider openai-codexopenclaw config get agents.defaults.model --jsonopenclaw config get models.providers.openai.agentRuntime --jsonPara um agente específico, adicione --agent <id>:
openclaw models status --agent <id>openclaw models auth list --agent <id> --provider openai-codexSe uma configuração mais antiga ainda tiver openai-codex/gpt-* ou um pin de sessão OpenAI PI
obsoleto sem configuração explícita de runtime, repare-a:
openclaw doctor --fixopenclaw config validateSe models auth list --provider openai-codex não mostrar nenhum perfil utilizável, entre
novamente:
openclaw models auth login --provider openai-codexopenclaw models status --probe --probe-provider openai-codexopenai/* é a rota de modelo para turnos de agentes da OpenAI pelo Codex. O id
de provedor de autenticação/perfil openai-codex continua aceito para perfis
existentes e listagem pela CLI.
Indicador de status
O chat /status mostra qual runtime de modelo está ativo para a sessão atual.
O harness do servidor de aplicativo do Codex empacotado aparece como Runtime: OpenAI Codex para
turnos de modelo de agentes da OpenAI. Pins de sessão PI obsoletos são reparados para Codex, a menos que
a configuração fixe explicitamente o PI.
Aviso do doctor
Se rotas openai-codex/* ou pins OpenAI PI obsoletos permanecerem na configuração ou no
estado da sessão, openclaw doctor --fix os reescreve para openai/* com o runtime
do Codex, a menos que o PI esteja explicitamente configurado.
Limite da janela de contexto
O OpenClaw trata metadados de modelo e o limite de contexto do runtime como valores separados.
Para openai/gpt-5.5 pelo catálogo OAuth do Codex:
contextWindownativo:1000000- Limite padrão de runtime
contextTokens:272000
Na prática, o limite padrão menor tem características melhores de latência e qualidade. Substitua-o com contextTokens:
{ models: { providers: { "openai-codex": { models: [{ id: "gpt-5.5", contextTokens: 160000 }], }, }, },}Recuperação do catálogo
O OpenClaw usa metadados do catálogo upstream do Codex para gpt-5.5 quando eles estão
presentes. Se a descoberta ao vivo do Codex omitir a linha gpt-5.5 enquanto
a conta estiver autenticada, o OpenClaw sintetiza essa linha de modelo OAuth para que
execuções de cron, subagente e modelo padrão configurado não falhem com
Unknown model.
Autenticação nativa do servidor de aplicativo do Codex
O harness nativo do servidor de aplicativo do Codex usa refs de modelo openai/* mais configuração
de runtime omitida ou provider/model agentRuntime.id: "codex", mas sua autenticação
ainda é baseada em conta. O OpenClaw seleciona a autenticação nesta ordem:
- Perfis de autenticação OpenAI ordenados para o agente, de preferência em
auth.order.openai. Perfisopenai-codex:*existentes eauth.order.openai-codexcontinuam válidos para instalações mais antigas. - A conta existente do servidor de aplicativo, como um login local do ChatGPT pela CLI do Codex.
- Somente para inicializações locais do servidor de aplicativo stdio,
CODEX_API_KEYe depoisOPENAI_API_KEY, quando o servidor de aplicativo não relata nenhuma conta e ainda exige autenticação OpenAI.
Isso significa que um login local de assinatura ChatGPT/Codex não é substituído apenas
porque o processo do gateway também tem OPENAI_API_KEY para modelos OpenAI diretos
ou embeddings. O fallback de chave de API por variável de ambiente é apenas o caminho local stdio sem conta; ele
não é enviado a conexões WebSocket do servidor de aplicativo. Quando um perfil de Codex
no estilo assinatura é selecionado, o OpenClaw também mantém CODEX_API_KEY e OPENAI_API_KEY
fora do processo filho stdio do servidor de aplicativo gerado e envia as credenciais selecionadas
pela RPC de login do servidor de aplicativo. Quando esse perfil de assinatura é bloqueado por um
limite de uso do Codex, o OpenClaw pode alternar para o próximo perfil de chave de API openai:*
ordenado sem mudar o modelo selecionado nem sair do harness do Codex. Depois que o
tempo de redefinição da assinatura passa, o perfil de assinatura fica elegível novamente.
Geração de imagens
O plugin openai empacotado registra geração de imagens pela ferramenta image_generate.
Ele oferece suporte tanto à geração de imagens com chave de API OpenAI quanto à geração de imagens
com OAuth do Codex pela mesma ref. de modelo openai/gpt-image-2.
| Recurso | Chave de API OpenAI | OAuth do Codex |
|---|---|---|
| Ref. do modelo | openai/gpt-image-2 |
openai/gpt-image-2 |
| Autenticação | OPENAI_API_KEY |
Login OAuth do OpenAI Codex |
| Transporte | API OpenAI Images | Backend Codex Responses |
| Máximo de imagens por solicitação | 4 | 4 |
| Modo de edição | Habilitado (até 5 imagens de referência) | Habilitado (até 5 imagens de referência) |
| Substituições de tamanho | Compatíveis, incluindo tamanhos 2K/4K | Compatíveis, incluindo tamanhos 2K/4K |
| Proporção / resolução | Não encaminhado para a API OpenAI Images | Mapeado para um tamanho compatível quando seguro |
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2" }, }, },}gpt-image-2 é o padrão tanto para geração de texto para imagem da OpenAI quanto para edição de imagens.
gpt-image-1.5, gpt-image-1 e gpt-image-1-mini continuam utilizáveis como
substituições explícitas de modelo. Use openai/gpt-image-1.5 para saída PNG/WebP
com fundo transparente; a API atual de gpt-image-2 rejeita
background: "transparent".
Para uma solicitação de fundo transparente, agentes devem chamar image_generate com
model: "openai/gpt-image-1.5", outputFormat: "png" ou "webp" e
background: "transparent"; a opção de provedor antiga openai.background ainda é
aceita. O OpenClaw também protege as rotas públicas OpenAI e
OpenAI Codex OAuth reescrevendo solicitações transparentes padrão openai/gpt-image-2
para gpt-image-1.5; endpoints Azure e OpenAI-compatíveis personalizados mantêm
seus nomes de implantação/modelo configurados.
A mesma configuração é exposta para execuções CLI sem interface:
openclaw infer image generate \ --model openai/gpt-image-1.5 \ --output-format png \ --background transparent \ --prompt "A simple red circle sticker on a transparent background" \ --jsonUse as mesmas flags --output-format e --background com
openclaw infer image edit ao começar a partir de um arquivo de entrada.
--openai-background permanece disponível como um alias específico da OpenAI.
Para instalações com OAuth do Codex, mantenha a mesma ref. openai/gpt-image-2. Quando um
perfil OAuth openai-codex estiver configurado, o OpenClaw resolve esse token de acesso OAuth
armazenado e envia solicitações de imagem pelo backend Codex Responses. Ele
não tenta primeiro OPENAI_API_KEY nem faz fallback silencioso para uma chave de API para essa
solicitação. Configure models.providers.openai explicitamente com uma chave de API,
URL base personalizada ou endpoint Azure quando quiser a rota direta da API OpenAI Images.
Se esse endpoint de imagem personalizado estiver em uma LAN/endereço privado confiável, também defina
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; o OpenClaw mantém
endpoints de imagem OpenAI-compatíveis privados/internos bloqueados, a menos que essa adesão explícita
esteja presente.
Gerar:
/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1Gerar um PNG transparente:
/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparentEditar:
/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536Geração de vídeo
O Plugin openai incluído registra geração de vídeo por meio da ferramenta video_generate.
| Recurso | Valor |
|---|---|
| Modelo padrão | openai/sora-2 |
| Modos | Texto para vídeo, imagem para vídeo, edição de vídeo único |
| Entradas de referência | 1 imagem ou 1 vídeo |
| Substituições de tamanho | Compatíveis |
| Outras substituições | aspectRatio, resolution, audio, watermark são ignorados com um aviso da ferramenta |
{ agents: { defaults: { videoGenerationModel: { primary: "openai/sora-2" }, }, },}Contribuição de prompt do GPT-5
O OpenClaw adiciona uma contribuição compartilhada de prompt do GPT-5 para execuções da família GPT-5 entre provedores. Ela se aplica pelo id do modelo, portanto openai/gpt-5.5, refs legadas anteriores ao reparo como openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 e outras refs compatíveis com GPT-5 recebem a mesma sobreposição. Modelos GPT-4.x mais antigos não recebem.
O harness Codex nativo incluído usa o mesmo comportamento do GPT-5 e a mesma sobreposição de Heartbeat por meio das instruções de desenvolvedor do servidor de aplicativo Codex, portanto sessões openai/gpt-5.x roteadas pelo Codex mantêm a mesma orientação de acompanhamento e Heartbeat proativo, embora o Codex seja dono do restante do prompt do harness.
A contribuição do GPT-5 adiciona um contrato de comportamento marcado para persistência de persona, segurança de execução, disciplina de ferramentas, formato de saída, verificações de conclusão e verificação. O comportamento de resposta específico do canal e de mensagem silenciosa permanece no prompt de sistema compartilhado do OpenClaw e na política de entrega de saída. A orientação do GPT-5 está sempre habilitada para modelos correspondentes. A camada de estilo de interação amigável é separada e configurável.
| Valor | Efeito |
|---|---|
"friendly" (padrão) |
Habilitar a camada de estilo de interação amigável |
"on" |
Alias para "friendly" |
"off" |
Desabilitar apenas a camada de estilo amigável |
Configuração
{ agents: { defaults: { promptOverlays: { gpt5: { personality: "friendly" }, }, }, },}CLI
openclaw config set agents.defaults.promptOverlays.gpt5.personality offVoz e fala
Síntese de fala (TTS)
O Plugin openai incluído registra síntese de fala para a superfície messages.tts.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Modelo | messages.tts.providers.openai.model |
gpt-4o-mini-tts |
| Voz | messages.tts.providers.openai.voice |
coral |
| Velocidade | messages.tts.providers.openai.speed |
(não definido) |
| Instruções | messages.tts.providers.openai.instructions |
(não definido, somente gpt-4o-mini-tts) |
| Formato | messages.tts.providers.openai.responseFormat |
opus para notas de voz, mp3 para arquivos |
| Chave de API | messages.tts.providers.openai.apiKey |
Recorre a OPENAI_API_KEY |
| URL base | messages.tts.providers.openai.baseUrl |
https://api.openai.com/v1 |
| Corpo extra | messages.tts.providers.openai.extraBody / extra_body |
(não definido) |
Modelos disponíveis: gpt-4o-mini-tts, tts-1, tts-1-hd. Vozes disponíveis: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.
extraBody é mesclado ao JSON da solicitação /audio/speech após os campos gerados pelo OpenClaw, portanto use-o para endpoints compatíveis com OpenAI que exigem chaves adicionais, como lang. Chaves de protótipo são ignoradas.
{ messages: { tts: { providers: { openai: { model: "gpt-4o-mini-tts", voice: "coral" }, }, }, },}Fala para texto
O Plugin openai incluído registra fala para texto em lote por meio da
superfície de transcrição de entendimento de mídia do OpenClaw.
- Modelo padrão:
gpt-4o-transcribe - Endpoint: REST OpenAI
/v1/audio/transcriptions - Caminho de entrada: upload de arquivo de áudio multipart
- Compatível com o OpenClaw sempre que a transcrição de áudio de entrada usa
tools.media.audio, incluindo segmentos de canal de voz do Discord e anexos de áudio de canal
Para forçar a OpenAI para transcrição de áudio de entrada:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "openai", model: "gpt-4o-transcribe", }, ], }, }, },}Dicas de idioma e prompt são encaminhadas para a OpenAI quando fornecidas pela configuração compartilhada de mídia de áudio ou pela solicitação de transcrição por chamada.
Transcrição em tempo real
O Plugin openai incluído registra transcrição em tempo real para o Plugin Voice Call.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.streaming.providers.openai.model |
gpt-4o-transcribe |
| Idioma | ...openai.language |
(não definido) |
| Prompt | ...openai.prompt |
(não definido) |
| Duração do silêncio | ...openai.silenceDurationMs |
800 |
| Limite de VAD | ...openai.vadThreshold |
0.5 |
| Autenticação | ...openai.apiKey, OPENAI_API_KEY ou OAuth openai-codex |
Chaves de API se conectam diretamente; OAuth emite um segredo de cliente de transcrição Realtime |
Voz em tempo real
O Plugin openai incluído registra voz em tempo real para o Plugin Voice Call.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.realtime.providers.openai.model |
gpt-realtime-2 |
| Voz | ...openai.voice |
alloy |
| Temperatura (ponte de implantação do Azure) | ...openai.temperature |
0.8 |
| Limite de VAD | ...openai.vadThreshold |
0.5 |
| Duração do silêncio | ...openai.silenceDurationMs |
500 |
| Preenchimento de prefixo | ...openai.prefixPaddingMs |
300 |
| Esforço de raciocínio | ...openai.reasoningEffort |
(não definido) |
| Autenticação | ...openai.apiKey, OPENAI_API_KEY ou OAuth openai-codex |
O Talk no navegador e pontes de backend que não sejam Azure podem usar OAuth do Codex |
Vozes Realtime integradas disponíveis para gpt-realtime-2: alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
A OpenAI recomenda marin e cedar para a melhor qualidade Realtime. Este
é um conjunto separado das vozes de texto para fala acima; não presuma que uma voz de TTS
como fable, nova ou onyx seja válida para sessões Realtime.
Endpoints do Azure OpenAI
O provedor openai incluído pode apontar para um recurso do Azure OpenAI para geração de imagens
substituindo a URL base. No caminho de geração de imagens, o OpenClaw
detecta nomes de host do Azure em models.providers.openai.baseUrl e muda para
o formato de solicitação do Azure automaticamente.
Use o Azure OpenAI quando:
- Você já tem uma assinatura, cota ou contrato empresarial do Azure OpenAI
- Você precisa de residência regional de dados ou controles de conformidade fornecidos pelo Azure
- Você quer manter o tráfego dentro de uma locação existente do Azure
Configuração
Para geração de imagens do Azure por meio do provedor openai incluído, aponte
models.providers.openai.baseUrl para o seu recurso do Azure e defina apiKey como
a chave do Azure OpenAI (não uma chave da OpenAI Platform):
{ models: { providers: { openai: { baseUrl: "https://<your-resource>.openai.azure.com", apiKey: "<azure-openai-api-key>", }, }, },}O OpenClaw reconhece estes sufixos de host do Azure para a rota de geração de imagens do Azure:
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
Para solicitações de geração de imagens em um host do Azure reconhecido, o OpenClaw:
- Envia o cabeçalho
api-keyem vez deAuthorization: Bearer - Usa caminhos com escopo de implantação (
/openai/deployments/{deployment}/...) - Anexa
?api-version=...a cada solicitação - Usa um tempo limite de solicitação padrão de 600s para chamadas de geração de imagens do Azure.
Valores
timeoutMspor chamada ainda substituem esse padrão.
Outras URLs base (OpenAI pública, proxies compatíveis com OpenAI) mantêm o formato padrão de solicitação de imagem da OpenAI.
Versão da API
Defina AZURE_OPENAI_API_VERSION para fixar uma versão específica de preview ou GA do Azure
para o caminho de geração de imagens do Azure:
export AZURE_OPENAI_API_VERSION="2024-12-01-preview"O padrão é 2024-12-01-preview quando a variável não está definida.
Nomes de modelos são nomes de implantação
O Azure OpenAI vincula modelos a implantações. Para solicitações de geração de imagens do Azure
roteadas pelo provedor openai incluído, o campo model no OpenClaw
deve ser o nome da implantação do Azure que você configurou no portal do Azure, não
o ID público do modelo da OpenAI.
Se você criar uma implantação chamada gpt-image-2-prod que serve gpt-image-2:
/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1A mesma regra de nome de implantação se aplica às chamadas de geração de imagens roteadas pelo
provedor openai incluído.
Disponibilidade regional
A geração de imagens do Azure está disponível atualmente apenas em um subconjunto de regiões
(por exemplo, eastus2, swedencentral, polandcentral, westus3,
uaenorth). Verifique a lista atual de regiões da Microsoft antes de criar uma
implantação e confirme se o modelo específico é oferecido na sua região.
Diferenças de parâmetros
O Azure OpenAI e a OpenAI pública nem sempre aceitam os mesmos parâmetros de imagem.
O Azure pode rejeitar opções que a OpenAI pública permite (por exemplo, certos valores de
background em gpt-image-2) ou expô-las apenas em versões específicas de modelo.
Essas diferenças vêm do Azure e do modelo subjacente, não do
OpenClaw. Se uma solicitação do Azure falhar com um erro de validação, verifique o
conjunto de parâmetros compatível com sua implantação específica e versão da API no
portal do Azure.
Configuração avançada
Transporte (WebSocket vs SSE)
O OpenClaw usa WebSocket primeiro com fallback para SSE ("auto") para openai/*.
No modo "auto", o OpenClaw:
- Tenta novamente uma falha inicial de WebSocket antes de fazer fallback para SSE
- Após uma falha, marca o WebSocket como degradado por ~60 segundos e usa SSE durante o período de resfriamento
- Anexa cabeçalhos estáveis de identidade de sessão e turno para novas tentativas e reconexões
- Normaliza contadores de uso (
input_tokens/prompt_tokens) entre variantes de transporte
| Valor | Comportamento |
|---|---|
"auto" (padrão) |
WebSocket primeiro, fallback para SSE |
"sse" |
Forçar apenas SSE |
"websocket" |
Forçar apenas WebSocket |
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { transport: "auto" }, }, }, }, },}Documentação relacionada da OpenAI:
Modo rápido
O OpenClaw expõe um alternador compartilhado de modo rápido para openai/*:
- Chat/UI:
/fast status|on|off - Configuração:
agents.defaults.models["<provider>/<model>"].params.fastMode
Quando ativado, o OpenClaw mapeia o modo rápido para o processamento prioritário da OpenAI (service_tier = "priority"). Valores existentes de service_tier são preservados, e o modo rápido não reescreve reasoning nem text.verbosity.
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { fastMode: true } }, }, }, },}Processamento prioritário (service_tier)
A API da OpenAI expõe processamento prioritário por meio de service_tier. Defina-o por modelo no OpenClaw:
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { serviceTier: "priority" } }, }, }, },}Valores compatíveis: auto, default, flex, priority.
Compaction no lado do servidor (Responses API)
Para modelos OpenAI Responses diretos (openai/* em api.openai.com), o wrapper de stream do harness Pi do Plugin OpenAI ativa automaticamente a compactação no lado do servidor:
- Força
store: true(a menos que a compatibilidade do modelo definasupportsStore: false) - Injeta
context_management: [{ type: "compaction", compact_threshold: ... }] compact_thresholdpadrão: 70% decontextWindow(ou80000quando indisponível)
Isso se aplica ao caminho integrado do harness Pi e aos hooks do provedor OpenAI usados por execuções incorporadas. O harness nativo do servidor de apps Codex gerencia seu próprio contexto por meio do Codex e é configurado pela rota padrão de agente da OpenAI ou pela política de runtime de provedor/modelo.
Ativar explicitamente
Útil para endpoints compatíveis, como Azure OpenAI Responses:
{ agents: { defaults: { models: { "azure-openai-responses/gpt-5.5": { params: { responsesServerCompaction: true }, }, }, }, },}Limite personalizado
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { responsesServerCompaction: true, responsesCompactThreshold: 120000, }, }, }, }, },}Desativar
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { responsesServerCompaction: false }, }, }, }, },}Modo GPT estritamente agêntico
Para execuções da família GPT-5 em openai/*, o OpenClaw pode usar um contrato de execução incorporado mais estrito:
{ agents: { defaults: { embeddedPi: { executionContract: "strict-agentic" }, }, },}Com strict-agentic, o OpenClaw:
- Não trata mais um turno apenas com plano como progresso bem-sucedido quando uma ação de ferramenta está disponível
- Tenta novamente o turno com uma orientação para agir agora
- Ativa automaticamente
update_planpara trabalhos substanciais - Expõe um estado bloqueado explícito se o modelo continuar planejando sem agir
Rotas nativas vs. compatíveis com OpenAI
O OpenClaw trata endpoints diretos da OpenAI, Codex e Azure OpenAI de forma diferente de proxies /v1 genéricos compatíveis com OpenAI:
Rotas nativas (openai/*, Azure OpenAI):
- Mantêm
reasoning: { effort: "none" }apenas para modelos compatíveis com o esforçononeda OpenAI - Omitem raciocínio desativado para modelos ou proxies que rejeitam
reasoning.effort: "none" - Definem esquemas de ferramentas como modo estrito por padrão
- Anexam cabeçalhos ocultos de atribuição apenas em hosts nativos verificados
- Mantêm formatação de solicitação exclusiva da OpenAI (
service_tier,store, compatibilidade de raciocínio, dicas de cache de prompt)
Rotas proxy/compatíveis:
- Usam comportamento de compatibilidade mais flexível
- Removem
storede Completions de payloadsopenai-completionsnão nativos - Aceitam JSON avançado de passagem direta
params.extra_body/params.extraBodypara proxies Completions compatíveis com OpenAI - Aceitam
params.chat_template_kwargspara proxies Completions compatíveis com OpenAI, como vLLM - Não forçam esquemas de ferramentas estritos nem cabeçalhos exclusivos de rotas nativas
O Azure OpenAI usa transporte nativo e comportamento compatível, mas não recebe os cabeçalhos ocultos de atribuição.
Relacionado
Escolha de provedores, referências de modelo e comportamento de failover.
Parâmetros compartilhados da ferramenta de imagem e seleção de provedor.
Parâmetros compartilhados da ferramenta de vídeo e seleção de provedor.
Detalhes de autenticação e regras de reutilização de credenciais.