Providers

OpenAI

OpenAI는 GPT 모델용 개발자 API를 제공하며, Codex는 OpenAI의 Codex 클라이언트를 통해 ChatGPT 플랜 코딩 에이전트로도 사용할 수 있습니다. OpenClaw는 구성이 예측 가능하게 유지되도록 이러한 표면을 분리합니다.

OpenClaw는 openai/*를 표준 OpenAI 모델 경로로 사용합니다. OpenAI 모델의 임베디드 에이전트 턴은 기본적으로 네이티브 Codex 앱 서버 런타임을 통해 실행됩니다. 직접 OpenAI API 키 인증은 이미지, 임베딩, 음성, 실시간과 같은 비에이전트 OpenAI 표면에서 계속 사용할 수 있습니다.

에이전트 모델 - Codex 런타임을 통한 openai/* 모델입니다. ChatGPT/Codex 구독 사용을 위해 Codex 인증으로 로그인하거나, 의도적으로 API 키 인증을 사용하려는 경우 Codex 호환 OpenAI API 키 백업을 구성하세요.
비에이전트 OpenAI API - OPENAI_API_KEY 또는 OpenAI API 키 온보딩을 통해 사용량 기반 과금으로 OpenAI Platform에 직접 액세스합니다.
레거시 구성 - openai-codex/* 모델 참조는 openclaw doctor --fix에 의해 openai/*와 Codex 런타임으로 복구됩니다.

OpenAI는 OpenClaw 같은 외부 도구와 워크플로에서 구독 OAuth 사용을 명시적으로 지원합니다.

공급자, 모델, 런타임, 채널은 별도의 계층입니다. 이러한 레이블이 서로 혼동되고 있다면 구성을 변경하기 전에 에이전트 런타임을 읽으세요.

빠른 선택

목표	사용	참고
네이티브 Codex 런타임이 포함된 ChatGPT/Codex 구독	`openai/gpt-5.5`	기본 OpenAI 에이전트 설정입니다. Codex 인증으로 로그인하세요.
에이전트 모델에 직접 API 키 과금	`openai/gpt-5.5`와 Codex 호환 API 키 프로필	`auth.order.openai`를 사용해 백업을 구독 인증 뒤에 배치하세요.
명시적 PI를 통한 직접 API 키 과금	`openai/gpt-5.5`와 공급자/모델 런타임 `pi`	일반 `openai` API 키 프로필을 선택하세요.
최신 ChatGPT Instant API 별칭	`openai/chat-latest`	직접 API 키 전용입니다. 기본값이 아닌 실험용 이동 별칭입니다.
명시적 PI를 통한 ChatGPT/Codex 구독 인증	`openai/gpt-5.5`와 공급자/모델 런타임 `pi`	호환성 경로를 위해 `openai-codex` 인증 프로필을 선택하세요.
이미지 생성 또는 편집	`openai/gpt-image-2`	`OPENAI_API_KEY` 또는 OpenAI Codex OAuth 모두에서 작동합니다.
투명 배경 이미지	`openai/gpt-image-1.5`	`outputFormat=png` 또는 `webp`와 `openai.background=transparent`를 사용하세요.

이름 매핑

이름은 비슷하지만 서로 바꿔 쓸 수 없습니다.

표시되는 이름	계층	의미
`openai`	공급자 접두사	표준 OpenAI 모델 경로입니다. 에이전트 턴은 Codex 런타임을 사용합니다.
`openai-codex`	레거시 인증/프로필 접두사	이전 OpenAI Codex OAuth/구독 프로필 네임스페이스입니다. 기존 프로필과 `auth.order.openai-codex`는 계속 작동합니다.
`codex` Plugin	Plugin	네이티브 Codex 앱 서버 런타임과 `/codex` 채팅 컨트롤을 제공하는 번들 OpenClaw Plugin입니다.
공급자/모델 `agentRuntime.id: codex`	에이전트 런타임	일치하는 임베디드 턴에 대해 네이티브 Codex 앱 서버 하네스를 강제합니다.
`/codex ...`	채팅 명령 세트	대화에서 Codex 앱 서버 스레드를 바인딩/제어합니다.
`runtime: "acp", agentId: "codex"`	ACP 세션 경로	ACP/acpx를 통해 Codex를 실행하는 명시적 대체 경로입니다.

이는 구성에 의도적으로 openai/* 모델 참조가 포함되면서도 인증 프로필은 Codex 호환 자격 증명을 가리킬 수 있음을 의미합니다. 새 구성에는 auth.order.openai를 선호하세요. 기존 openai-codex:* 프로필과 auth.order.openai-codex는 계속 지원됩니다. openclaw doctor --fix는 레거시 openai-codex/* 모델 참조를 표준 OpenAI 모델 경로로 다시 씁니다.

OpenClaw 기능 범위

OpenAI 기능	OpenClaw 표면	상태
채팅 / Responses	`openai/<model>` 모델 공급자	예
Codex 구독 모델	`openai/<model>`과 `openai-codex` OAuth	예
레거시 Codex 모델 참조	`openai-codex/<model>`	doctor가 `openai/<model>`로 복구함
Codex 앱 서버 하네스	런타임 생략 또는 공급자/모델 `agentRuntime.id: codex`가 있는 `openai/<model>`	예
서버 측 웹 검색	네이티브 OpenAI Responses 도구	웹 검색이 활성화되고 공급자가 고정되지 않은 경우 예
이미지	`image_generate`	예
동영상	`video_generate`	예
텍스트 음성 변환	`messages.tts.provider: "openai"` / `tts`	예
일괄 음성 텍스트 변환	`tools.media.audio` / 미디어 이해	예
스트리밍 음성 텍스트 변환	Voice Call `streaming.provider: "openai"`	예
실시간 음성	Voice Call `realtime.provider: "openai"` / Control UI Talk	예
임베딩	메모리 임베딩 공급자	예

메모리 임베딩

OpenClaw는 memory_search 인덱싱 및 쿼리 임베딩에 OpenAI 또는 OpenAI 호환 임베딩 엔드포인트를 사용할 수 있습니다.

json5

{  agents: {    defaults: {      memorySearch: {        provider: "openai",        model: "text-embedding-3-small",      },    },  },}

비대칭 임베딩 레이블이 필요한 OpenAI 호환 엔드포인트의 경우 memorySearch 아래에 queryInputType과 documentInputType을 설정하세요. OpenClaw는 이를 공급자별 input_type 요청 필드로 전달합니다. 쿼리 임베딩은 queryInputType을 사용하고, 인덱싱된 메모리 청크와 일괄 인덱싱은 documentInputType을 사용합니다. 전체 예시는 메모리 구성 참조를 참고하세요.

시작하기

선호하는 인증 방법을 선택하고 설정 단계를 따르세요.

API 키 (OpenAI Platform)

적합한 용도: 직접 API 액세스 및 사용량 기반 과금.

API 키 가져오기

OpenAI Platform 대시보드에서 API 키를 만들거나 복사하세요.

온보딩 실행

bash

openclaw onboard --auth-choice openai-api-key

또는 키를 직접 전달하세요.

bash

openclaw onboard --openai-api-key "$OPENAI_API_KEY"

모델을 사용할 수 있는지 확인

bash

openclaw models list --provider openai

경로 요약

모델 참조	런타임 구성	경로	인증
`openai/gpt-5.5`	생략 / 공급자/모델 `agentRuntime.id: "codex"`	Codex 앱 서버 하네스	Codex 호환 OpenAI 프로필
`openai/gpt-5.4-mini`	생략 / 공급자/모델 `agentRuntime.id: "codex"`	Codex 앱 서버 하네스	Codex 호환 OpenAI 프로필
`openai/gpt-5.5`	공급자/모델 `agentRuntime.id: "pi"`	PI 임베디드 런타임	`openai` 프로필 또는 선택한 `openai-codex` 프로필

구성 예시

json5

{  env: { OPENAI_API_KEY: "sk-..." },  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}

OpenAI API에서 ChatGPT의 현재 Instant 모델을 사용해 보려면 모델을 openai/chat-latest로 설정하세요.

json5

{  env: { OPENAI_API_KEY: "sk-..." },  agents: { defaults: { model: { primary: "openai/chat-latest" } } },}

chat-latest는 이동 별칭입니다. OpenAI는 이를 ChatGPT에서 사용되는 최신 Instant 모델로 문서화하며, 프로덕션 API 사용에는 gpt-5.5를 권장합니다. 따라서 해당 별칭 동작을 명시적으로 원하는 경우가 아니라면 openai/gpt-5.5를 안정적인 기본값으로 유지하세요. 이 별칭은 현재 medium 텍스트 상세도만 허용하므로, OpenClaw는 이 모델에 대해 호환되지 않는 OpenAI 텍스트 상세도 재정의를 정규화합니다.

Codex 구독

적합한 경우: 별도의 API 키 대신 네이티브 Codex 앱 서버 실행으로 ChatGPT/Codex 구독을 사용하는 경우. Codex 클라우드에는 ChatGPT 로그인이 필요합니다.

Codex OAuth 실행

bash

openclaw onboard --auth-choice openai-codex

또는 OAuth를 직접 실행합니다.

bash

openclaw models auth login --provider openai-codex

헤드리스 또는 콜백을 사용하기 어려운 설정에서는 --device-code를 추가해 localhost 브라우저 콜백 대신 ChatGPT 디바이스 코드 흐름으로 로그인합니다.

bash

openclaw models auth login --provider openai-codex --device-code

표준 OpenAI 모델 경로 사용

bash

openclaw config set agents.defaults.model.primary openai/gpt-5.5

기본 경로에는 런타임 구성이 필요하지 않습니다. OpenAI 에이전트 턴은 네이티브 Codex 앱 서버 런타임을 자동으로 선택하며, 이 경로를 선택하면 OpenClaw가 번들 Codex Plugin을 설치하거나 복구합니다.

Codex 인증 사용 가능 여부 확인

bash

openclaw models list --provider openai-codex

Gateway가 실행된 후 채팅에서 /codex status 또는 /codex models를 보내 네이티브 앱 서버 런타임을 확인합니다.

경로 요약

모델 참조	런타임 구성	경로	인증
`openai/gpt-5.5`	생략됨 / provider/model `agentRuntime.id: "codex"`	네이티브 Codex 앱 서버 하네스	Codex 로그인 또는 정렬된 `openai` 인증 프로필
`openai/gpt-5.5`	provider/model `agentRuntime.id: "pi"`	내부 Codex 인증 전송을 사용하는 PI 임베디드 런타임	선택된 `openai-codex` 프로필
`openai-codex/gpt-5.5`	doctor가 복구	`openai/gpt-5.5`로 다시 작성되는 레거시 경로	기존 `openai-codex` 프로필

구성 예시

json5

{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },}

API 키 백업이 있는 경우 모델은 openai/gpt-5.5로 유지하고 인증 순서는 openai 아래에 둡니다. OpenClaw는 Codex 하네스를 유지하면서 먼저 구독을 시도한 다음 API 키를 시도합니다.

json5

{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },  auth: {    order: {      openai: [        "openai-codex:[email protected]",        "openai:api-key-backup",      ],    },  },}

Codex OAuth 라우팅 확인 및 복구

기본 에이전트가 어떤 모델, 런타임, 인증 경로를 사용하는지 확인하려면 다음 명령을 사용합니다.

bash

openclaw models statusopenclaw models auth list --provider openai-codexopenclaw config get agents.defaults.model --jsonopenclaw config get models.providers.openai.agentRuntime --json

특정 에이전트의 경우 --agent <id>를 추가합니다.

bash

openclaw models status --agent <id>openclaw models auth list --agent <id> --provider openai-codex

이전 구성에 아직 openai-codex/gpt-*가 있거나 명시적 런타임 구성 없이 오래된 OpenAI PI 세션 고정이 남아 있으면 복구합니다.

bash

openclaw doctor --fixopenclaw config validate

models auth list --provider openai-codex에 사용 가능한 프로필이 표시되지 않으면 다시 로그인합니다.

bash

openclaw models auth login --provider openai-codexopenclaw models status --probe --probe-provider openai-codex

openai/*는 Codex를 통한 OpenAI 에이전트 턴의 모델 경로입니다. 기존 프로필과 CLI 목록에서는 openai-codex 인증/프로필 provider id가 계속 허용됩니다.

상태 표시기

채팅 /status는 현재 세션에서 활성화된 모델 런타임을 보여 줍니다. 번들 Codex 앱 서버 하네스는 OpenAI 에이전트 모델 턴에서 Runtime: OpenAI Codex로 표시됩니다. 오래된 PI 세션 고정은 구성에서 PI를 명시적으로 고정하지 않는 한 Codex로 복구됩니다.

Doctor 경고

openai-codex/* 경로 또는 오래된 OpenAI PI 고정이 구성이나 세션 상태에 남아 있으면, openclaw doctor --fix는 PI가 명시적으로 구성된 경우를 제외하고 이를 Codex 런타임이 있는 openai/*로 다시 작성합니다.

컨텍스트 창 상한

OpenClaw는 모델 메타데이터와 런타임 컨텍스트 상한을 별도 값으로 취급합니다.

Codex OAuth 카탈로그를 통한 openai/gpt-5.5의 경우:

네이티브 contextWindow: 1000000
기본 런타임 contextTokens 상한: 272000

더 작은 기본 상한은 실제 사용에서 지연 시간과 품질 특성이 더 좋습니다. contextTokens로 재정의하세요.

json5

{  models: {    providers: {      "openai-codex": {        models: [{ id: "gpt-5.5", contextTokens: 160000 }],      },    },  },}

카탈로그 복구

OpenClaw는 gpt-5.5가 있는 경우 업스트림 Codex 카탈로그 메타데이터를 사용합니다. 계정이 인증된 상태에서 라이브 Codex 탐색이 gpt-5.5 행을 누락하면, OpenClaw는 해당 OAuth 모델 행을 합성하여 cron, 하위 에이전트, 구성된 기본 모델 실행이 Unknown model로 실패하지 않도록 합니다.

네이티브 Codex 앱 서버 인증

네이티브 Codex 앱 서버 하네스는 openai/* 모델 참조와 생략된 런타임 구성 또는 provider/model agentRuntime.id: "codex"를 사용하지만, 인증은 여전히 계정 기반입니다. OpenClaw는 다음 순서로 인증을 선택합니다.

에이전트에 대해 정렬된 OpenAI 인증 프로필, 가능하면 auth.order.openai 아래의 프로필. 기존 openai-codex:* 프로필과 auth.order.openai-codex는 이전 설치에서도 계속 유효합니다.
로컬 Codex CLI ChatGPT 로그인과 같은 앱 서버의 기존 계정.
로컬 stdio 앱 서버 실행에 한해, 앱 서버가 계정이 없다고 보고하면서 여전히 OpenAI 인증을 요구하는 경우 CODEX_API_KEY, 그다음 OPENAI_API_KEY.

즉, Gateway 프로세스가 직접 OpenAI 모델이나 임베딩용 OPENAI_API_KEY를 함께 가지고 있다고 해서 로컬 ChatGPT/Codex 구독 로그인이 대체되지는 않습니다. Env API 키 폴백은 로컬 stdio 무계정 경로에서만 사용되며, WebSocket 앱 서버 연결로 전송되지 않습니다. 구독 스타일 Codex 프로필이 선택되면 OpenClaw는 생성된 stdio 앱 서버 자식 프로세스에서 CODEX_API_KEY와 OPENAI_API_KEY도 제외하고 선택된 자격 증명을 앱 서버 로그인 RPC를 통해 보냅니다. 해당 구독 프로필이 Codex 사용량 한도에 막히면, OpenClaw는 선택된 모델을 변경하거나 Codex 하네스를 벗어나지 않고 다음 순서의 openai:* API 키 프로필로 전환할 수 있습니다. 구독 재설정 시간이 지나면 구독 프로필은 다시 사용 가능해집니다.

이미지 생성

번들 openai Plugin은 image_generate 도구를 통해 이미지 생성을 등록합니다. 동일한 openai/gpt-image-2 모델 참조를 통해 OpenAI API 키 이미지 생성과 Codex OAuth 이미지 생성을 모두 지원합니다.

기능	OpenAI API 키	Codex OAuth
모델 참조	`openai/gpt-image-2`	`openai/gpt-image-2`
인증	`OPENAI_API_KEY`	OpenAI Codex OAuth 로그인
전송	OpenAI Images API	Codex Responses 백엔드
요청당 최대 이미지 수	4	4
편집 모드	사용 가능(최대 5개의 참조 이미지)	사용 가능(최대 5개의 참조 이미지)
크기 재정의	지원됨, 2K/4K 크기 포함	지원됨, 2K/4K 크기 포함
종횡비 / 해상도	OpenAI Images API로 전달되지 않음	안전한 경우 지원되는 크기에 매핑됨

json5

{  agents: {    defaults: {      imageGenerationModel: { primary: "openai/gpt-image-2" },    },  },}

gpt-image-2는 OpenAI 텍스트-이미지 생성과 이미지 편집 모두의 기본값입니다. gpt-image-1.5, gpt-image-1, gpt-image-1-mini도 명시적 모델 재정의로 계속 사용할 수 있습니다. 투명 배경 PNG/WebP 출력에는 openai/gpt-image-1.5를 사용하세요. 현재 gpt-image-2 API는 background: "transparent"를 거부합니다.

투명 배경 요청의 경우 에이전트는 image_generate를 model: "openai/gpt-image-1.5", outputFormat: "png" 또는 "webp", 그리고 background: "transparent"와 함께 호출해야 합니다. 이전 openai.background provider 옵션도 계속 허용됩니다. OpenClaw는 또한 기본 openai/gpt-image-2 투명 요청을 gpt-image-1.5로 다시 작성하여 공개 OpenAI 및 OpenAI Codex OAuth 경로를 보호합니다. Azure 및 사용자 지정 OpenAI 호환 엔드포인트는 구성된 배포/모델 이름을 유지합니다.

헤드리스 CLI 실행에도 동일한 설정이 노출됩니다.

bash

openclaw infer image generate \  --model openai/gpt-image-1.5 \  --output-format png \  --background transparent \  --prompt "A simple red circle sticker on a transparent background" \  --json

입력 파일에서 시작할 때는 openclaw infer image edit와 함께 동일한 --output-format 및 --background 플래그를 사용합니다. --openai-background는 OpenAI 전용 별칭으로 계속 사용할 수 있습니다.

Codex OAuth 설치의 경우 동일한 openai/gpt-image-2 참조를 유지하세요. openai-codex OAuth 프로필이 구성되어 있으면 OpenClaw는 저장된 OAuth 액세스 토큰을 확인하고 Codex Responses 백엔드를 통해 이미지 요청을 보냅니다. 해당 요청에 대해 먼저 OPENAI_API_KEY를 시도하거나 API 키로 조용히 폴백하지 않습니다. 대신 직접 OpenAI Images API 경로를 원할 때는 API 키, 사용자 지정 기본 URL 또는 Azure 엔드포인트로 models.providers.openai를 명시적으로 구성하세요. 해당 사용자 지정 이미지 엔드포인트가 신뢰할 수 있는 LAN/사설 주소에 있는 경우 browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true도 설정하세요. OpenClaw는 이 옵트인이 없으면 사설/내부 OpenAI 호환 이미지 엔드포인트를 계속 차단합니다.

생성:

Code

/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1

투명 PNG 생성:

Code

/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent

편집:

Code

/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

동영상 생성

번들로 제공되는 openai Plugin은 video_generate 도구를 통해 동영상 생성을 등록합니다.

기능	값
기본 모델	`openai/sora-2`
모드	텍스트-동영상, 이미지-동영상, 단일 동영상 편집
참조 입력	이미지 1개 또는 동영상 1개
크기 재정의	지원됨
기타 재정의	`aspectRatio`, `resolution`, `audio`, `watermark`는 도구 경고와 함께 무시됩니다

json5

{  agents: {    defaults: {      videoGenerationModel: { primary: "openai/sora-2" },    },  },}

GPT-5 프롬프트 기여

OpenClaw는 제공자 전반의 GPT-5 계열 실행에 대해 공유 GPT-5 프롬프트 기여를 추가합니다. 이는 모델 ID별로 적용되므로 openai/gpt-5.5, openai-codex/gpt-5.5 같은 레거시 복구 전 참조, openrouter/openai/gpt-5.5, opencode/gpt-5.5 및 기타 호환 GPT-5 참조는 동일한 오버레이를 받습니다. 이전 GPT-4.x 모델에는 적용되지 않습니다.

번들로 제공되는 네이티브 Codex 하네스는 Codex 앱 서버 개발자 지침을 통해 동일한 GPT-5 동작과 Heartbeat 오버레이를 사용하므로, Codex를 통해 라우팅되는 openai/gpt-5.x 세션은 Codex가 나머지 하네스 프롬프트를 소유하더라도 동일한 후속 처리와 선제적 Heartbeat 지침을 유지합니다.

GPT-5 기여는 페르소나 지속성, 실행 안전성, 도구 규율, 출력 형태, 완료 검사, 검증에 대한 태그가 지정된 동작 계약을 추가합니다. 채널별 응답 및 무음 메시지 동작은 공유 OpenClaw 시스템 프롬프트와 아웃바운드 전달 정책에 남아 있습니다. GPT-5 지침은 일치하는 모델에 대해 항상 활성화됩니다. 친근한 상호작용 스타일 계층은 별도이며 구성할 수 있습니다.

값	효과
`"friendly"` (기본값)	친근한 상호작용 스타일 계층 활성화
`"on"`	`"friendly"`의 별칭
`"off"`	친근한 스타일 계층만 비활성화

구성

json5

{  agents: {    defaults: {      promptOverlays: {        gpt5: { personality: "friendly" },      },    },  },}

CLI

bash

openclaw config set agents.defaults.promptOverlays.gpt5.personality off

음성 및 말하기

음성 합성(TTS)

번들로 제공되는 openai Plugin은 messages.tts 표면에 음성 합성을 등록합니다.

설정	구성 경로	기본값
모델	`messages.tts.providers.openai.model`	`gpt-4o-mini-tts`
음성	`messages.tts.providers.openai.voice`	`coral`
속도	`messages.tts.providers.openai.speed`	(설정 안 됨)
지침	`messages.tts.providers.openai.instructions`	(설정 안 됨, `gpt-4o-mini-tts`만 해당)
형식	`messages.tts.providers.openai.responseFormat`	음성 메모에는 `opus`, 파일에는 `mp3`
API 키	`messages.tts.providers.openai.apiKey`	`OPENAI_API_KEY`로 폴백
기본 URL	`messages.tts.providers.openai.baseUrl`	`https://api.openai.com/v1`
추가 본문	`messages.tts.providers.openai.extraBody` / `extra_body`	(설정 안 됨)

사용 가능한 모델: gpt-4o-mini-tts, tts-1, tts-1-hd. 사용 가능한 음성: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.

extraBody는 OpenClaw가 생성한 필드 뒤에 /audio/speech 요청 JSON으로 병합되므로, lang 같은 추가 키가 필요한 OpenAI 호환 엔드포인트에 사용하세요. 프로토타입 키는 무시됩니다.

json5

{  messages: {    tts: {      providers: {        openai: { model: "gpt-4o-mini-tts", voice: "coral" },      },    },  },}

음성-텍스트 변환

번들로 제공되는 openai Plugin은 OpenClaw의 미디어 이해 전사 표면을 통해 배치 음성-텍스트 변환을 등록합니다.

기본 모델: gpt-4o-transcribe
엔드포인트: OpenAI REST /v1/audio/transcriptions
입력 경로: multipart 오디오 파일 업로드
Discord 음성 채널 세그먼트와 채널 오디오 첨부 파일을 포함하여 인바운드 오디오 전사가 tools.media.audio를 사용하는 모든 곳에서 OpenClaw가 지원

인바운드 오디오 전사에 OpenAI를 강제하려면:

json5

{  tools: {    media: {      audio: {        models: [          {            type: "provider",            provider: "openai",            model: "gpt-4o-transcribe",          },        ],      },    },  },}

언어와 프롬프트 힌트는 공유 오디오 미디어 구성 또는 호출별 전사 요청에서 제공되는 경우 OpenAI로 전달됩니다.

실시간 전사

번들된 openai Plugin은 Voice Call Plugin용 실시간 전사를 등록합니다.

설정	구성 경로	기본값
모델	`plugins.entries.voice-call.config.streaming.providers.openai.model`	`gpt-4o-transcribe`
언어	`...openai.language`	(설정되지 않음)
프롬프트	`...openai.prompt`	(설정되지 않음)
무음 지속 시간	`...openai.silenceDurationMs`	`800`
VAD 임계값	`...openai.vadThreshold`	`0.5`
인증	`...openai.apiKey`, `OPENAI_API_KEY` 또는 `openai-codex` OAuth	API 키는 직접 연결합니다. OAuth는 Realtime 전사 클라이언트 시크릿을 발급합니다.

실시간 음성

번들된 openai Plugin은 Voice Call Plugin용 실시간 음성을 등록합니다.

설정	구성 경로	기본값
모델	`plugins.entries.voice-call.config.realtime.providers.openai.model`	`gpt-realtime-2`
음성	`...openai.voice`	`alloy`
Temperature(Azure 배포 브리지)	`...openai.temperature`	`0.8`
VAD 임계값	`...openai.vadThreshold`	`0.5`
무음 지속 시간	`...openai.silenceDurationMs`	`500`
접두사 패딩	`...openai.prefixPaddingMs`	`300`
추론 노력 수준	`...openai.reasoningEffort`	(설정되지 않음)
인증	`...openai.apiKey`, `OPENAI_API_KEY` 또는 `openai-codex` OAuth	Browser Talk와 비 Azure 백엔드 브리지는 Codex OAuth를 사용할 수 있습니다.

gpt-realtime-2에서 사용할 수 있는 기본 제공 Realtime 음성: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. OpenAI는 최상의 Realtime 품질을 위해 marin 및 cedar를 권장합니다. 이는 위의 텍스트 음성 변환 음성과는 별도의 세트입니다. fable, nova, onyx 같은 TTS 음성이 Realtime 세션에 유효하다고 가정하지 마세요.

Note

Control UI Talk는 Gateway가 발급한 임시 클라이언트 시크릿과 OpenAI Realtime API를 상대로 하는 직접 브라우저 WebRTC SDP 교환을 통해 OpenAI 브라우저 실시간 세션을 사용합니다. 직접 OpenAI API 키가 구성되지 않은 경우 Gateway는 선택된 openai-codex OAuth 프로필로 해당 클라이언트 시크릿을 발급할 수 있습니다. Gateway 릴레이와 Voice Call 백엔드 실시간 WebSocket 브리지는 네이티브 OpenAI 엔드포인트에 동일한 OAuth 대체 경로를 사용합니다. 유지관리자 라이브 검증은 OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts로 사용할 수 있습니다. OpenAI 구간은 시크릿을 로깅하지 않고 백엔드 WebSocket 브리지와 브라우저 WebRTC SDP 교환을 모두 검증합니다.

Azure OpenAI 엔드포인트

번들된 openai 제공자는 기본 URL을 재정의하여 이미지 생성을 Azure OpenAI 리소스로 보낼 수 있습니다. 이미지 생성 경로에서 OpenClaw는 models.providers.openai.baseUrl의 Azure 호스트 이름을 감지하고 자동으로 Azure 요청 형태로 전환합니다.

다음과 같은 경우 Azure OpenAI를 사용하세요.

Azure OpenAI 구독, 할당량 또는 엔터프라이즈 계약을 이미 보유하고 있는 경우
Azure가 제공하는 지역 데이터 상주 또는 규정 준수 제어가 필요한 경우
기존 Azure 테넌시 내부에 트래픽을 유지하려는 경우

구성

번들된 openai 제공자를 통한 Azure 이미지 생성의 경우 models.providers.openai.baseUrl을 Azure 리소스로 지정하고 apiKey를 OpenAI Platform 키가 아닌 Azure OpenAI 키로 설정하세요.

json5

{  models: {    providers: {      openai: {        baseUrl: "https://<your-resource>.openai.azure.com",        apiKey: "<azure-openai-api-key>",      },    },  },}

OpenClaw는 Azure 이미지 생성 경로에 대해 다음 Azure 호스트 접미사를 인식합니다.

*.openai.azure.com
*.services.ai.azure.com
*.cognitiveservices.azure.com

인식된 Azure 호스트의 이미지 생성 요청에 대해 OpenClaw는 다음을 수행합니다.

Authorization: Bearer 대신 api-key 헤더를 보냅니다.
배포 범위 경로(/openai/deployments/{deployment}/...)를 사용합니다.
각 요청에 ?api-version=...을 추가합니다.
Azure 이미지 생성 호출에 600초 기본 요청 제한 시간을 사용합니다. 호출별 timeoutMs 값은 여전히 이 기본값을 재정의합니다.

다른 기본 URL(공개 OpenAI, OpenAI 호환 프록시)은 표준 OpenAI 이미지 요청 형태를 유지합니다.

API 버전

Azure 이미지 생성 경로에 대해 특정 Azure 프리뷰 또는 GA 버전을 고정하려면 AZURE_OPENAI_API_VERSION을 설정하세요.

bash

export AZURE_OPENAI_API_VERSION="2024-12-01-preview"

변수가 설정되지 않은 경우 기본값은 2024-12-01-preview입니다.

모델 이름은 배포 이름입니다

Azure OpenAI는 모델을 배포에 바인딩합니다. 번들된 openai provider를 통해 라우팅되는 Azure 이미지 생성 요청의 경우, OpenClaw의 model 필드는 공개 OpenAI 모델 ID가 아니라 Azure 포털에서 구성한 Azure 배포 이름이어야 합니다.

gpt-image-2를 제공하는 gpt-image-2-prod라는 배포를 만드는 경우:

Code

/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1

동일한 배포 이름 규칙은 번들된 openai provider를 통해 라우팅되는 이미지 생성 호출에도 적용됩니다.

지역별 가용성

Azure 이미지 생성은 현재 일부 지역에서만 사용할 수 있습니다 (예: eastus2, swedencentral, polandcentral, westus3, uaenorth). 배포를 만들기 전에 Microsoft의 현재 지역 목록을 확인하고, 특정 모델이 해당 지역에서 제공되는지 확인하세요.

매개변수 차이

Azure OpenAI와 공개 OpenAI가 항상 동일한 이미지 매개변수를 허용하는 것은 아닙니다. Azure는 공개 OpenAI가 허용하는 옵션(예: gpt-image-2의 특정 background 값)을 거부하거나, 특정 모델 버전에서만 노출할 수 있습니다. 이러한 차이는 OpenClaw가 아니라 Azure와 기본 모델에서 비롯됩니다. Azure 요청이 유효성 검사 오류로 실패하면 Azure 포털에서 특정 배포와 API 버전이 지원하는 매개변수 집합을 확인하세요.

고급 구성

전송(WebSocket과 SSE)

OpenClaw는 openai/*에 대해 WebSocket 우선, SSE 폴백("auto")을 사용합니다.

"auto" 모드에서 OpenClaw는 다음을 수행합니다.

SSE로 폴백하기 전에 초기 WebSocket 실패를 한 번 재시도합니다
실패 후 약 60초 동안 WebSocket을 성능 저하 상태로 표시하고 쿨다운 중에는 SSE를 사용합니다
재시도와 재연결을 위해 안정적인 세션 및 턴 식별 헤더를 첨부합니다
전송 변형 전반에서 사용량 카운터(input_tokens / prompt_tokens)를 정규화합니다

값	동작
`"auto"` (기본값)	WebSocket 우선, SSE 폴백
`"sse"`	SSE만 강제
`"websocket"`	WebSocket만 강제

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: { transport: "auto" },        },      },    },  },}

명시적으로 활성화

Azure OpenAI Responses 같은 호환 엔드포인트에 유용합니다.

json5

{  agents: {    defaults: {      models: {        "azure-openai-responses/gpt-5.5": {          params: { responsesServerCompaction: true },        },      },    },  },}

사용자 지정 임계값

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: {            responsesServerCompaction: true,            responsesCompactThreshold: 120000,          },        },      },    },  },}

비활성화

json5

{  agents: {    defaults: {      models: {        "openai/gpt-5.5": {          params: { responsesServerCompaction: false },        },      },    },  },}

Strict-agentic GPT 모드

openai/*의 GPT-5 계열 실행에서 OpenClaw는 더 엄격한 임베디드 실행 계약을 사용할 수 있습니다.

json5

{  agents: {    defaults: {      embeddedPi: { executionContract: "strict-agentic" },    },  },}

strict-agentic에서 OpenClaw는 다음을 수행합니다.

도구 작업을 사용할 수 있을 때 계획만 있는 턴을 더 이상 성공적인 진행으로 간주하지 않습니다
즉시 실행 유도로 턴을 재시도합니다
상당한 작업에는 update_plan을 자동으로 활성화합니다
모델이 계속 계획만 하고 실행하지 않으면 명시적인 차단 상태를 표시합니다

네이티브와 OpenAI 호환 경로

OpenClaw는 직접 OpenAI, Codex, Azure OpenAI 엔드포인트를 일반 OpenAI 호환 /v1 프록시와 다르게 처리합니다.

네이티브 경로(openai/*, Azure OpenAI):

OpenAI none effort를 지원하는 모델에 대해서만 reasoning: { effort: "none" }을 유지합니다
reasoning.effort: "none"을 거부하는 모델 또는 프록시에 대해 비활성화된 reasoning을 생략합니다
도구 스키마를 기본적으로 엄격 모드로 설정합니다
검증된 네이티브 호스트에만 숨겨진 어트리뷰션 헤더를 첨부합니다
OpenAI 전용 요청 형태(service_tier, store, reasoning 호환성, prompt-cache 힌트)를 유지합니다

프록시/호환 경로:

더 느슨한 호환 동작을 사용합니다
네이티브가 아닌 openai-completions 페이로드에서 Completions store를 제거합니다
OpenAI 호환 Completions 프록시에 대해 고급 params.extra_body/params.extraBody 통과 JSON을 허용합니다
vLLM 같은 OpenAI 호환 Completions 프록시에 대해 params.chat_template_kwargs를 허용합니다
엄격한 도구 스키마 또는 네이티브 전용 헤더를 강제하지 않습니다

Azure OpenAI는 네이티브 전송 및 호환 동작을 사용하지만 숨겨진 어트리뷰션 헤더는 받지 않습니다.

빠른 선택

이름 매핑

OpenClaw 기능 범위

메모리 임베딩

시작하기

API 키 (OpenAI Platform)

API 키 가져오기

온보딩 실행

모델을 사용할 수 있는지 확인

경로 요약

구성 예시

Codex 구독

Codex OAuth 실행

표준 OpenAI 모델 경로 사용

Codex 인증 사용 가능 여부 확인

경로 요약

구성 예시

Codex OAuth 라우팅 확인 및 복구

상태 표시기

Doctor 경고

컨텍스트 창 상한

카탈로그 복구

네이티브 Codex 앱 서버 인증

이미지 생성

동영상 생성

GPT-5 프롬프트 기여

구성

CLI

음성 및 말하기

Azure OpenAI 엔드포인트

구성

API 버전

모델 이름은 배포 이름입니다

지역별 가용성

매개변수 차이

고급 구성

명시적으로 활성화

사용자 지정 임계값

비활성화

관련 항목