Tools
Afbeeldingsgeneratie
Met de tool image_generate kan de agent afbeeldingen maken en bewerken met je
geconfigureerde providers. Gegenereerde afbeeldingen worden automatisch geleverd
als mediabijlagen in het antwoord van de agent.
Snelstart
Configure auth
Stel een API-sleutel in voor minstens één provider (bijvoorbeeld OPENAI_API_KEY,
GEMINI_API_KEY, OPENROUTER_API_KEY) of meld je aan met OpenAI Codex OAuth.
Pick a default model (optional)
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2", timeoutMs: 180_000, }, }, },}Codex OAuth gebruikt dezelfde modelreferentie openai/gpt-image-2. Wanneer
een OAuth-profiel openai-codex is geconfigureerd, routeert OpenClaw
afbeeldingsverzoeken via dat OAuth-profiel in plaats van eerst
OPENAI_API_KEY te proberen. Expliciete configuratie van
models.providers.openai (API-sleutel, aangepaste/Azure-basis-URL) schakelt
terug naar de directe route via de OpenAI Images API.
Ask the agent
"Genereer een afbeelding van een vriendelijke robotmascotte."
De agent roept image_generate automatisch aan. Er is geen allow-listing
voor tools nodig: deze is standaard ingeschakeld wanneer een provider
beschikbaar is.
Veelgebruikte routes
| Doel | Modelreferentie | Auth |
|---|---|---|
| OpenAI-afbeeldingsgeneratie met API-facturering | openai/gpt-image-2 |
OPENAI_API_KEY |
| OpenAI-afbeeldingsgeneratie met Codex-abonnementsauth | openai/gpt-image-2 |
OpenAI Codex OAuth |
| OpenAI PNG/WebP met transparante achtergrond | openai/gpt-image-1.5 |
OPENAI_API_KEY of OpenAI Codex OAuth |
| DeepInfra-afbeeldingsgeneratie | deepinfra/black-forest-labs/FLUX-1-schnell |
DEEPINFRA_API_KEY |
| OpenRouter-afbeeldingsgeneratie | openrouter/google/gemini-3.1-flash-image-preview |
OPENROUTER_API_KEY |
| LiteLLM-afbeeldingsgeneratie | litellm/gpt-image-2 |
LITELLM_API_KEY |
| Google Gemini-afbeeldingsgeneratie | google/gemini-3.1-flash-image-preview |
GEMINI_API_KEY of GOOGLE_API_KEY |
Dezelfde tool image_generate verwerkt tekst-naar-afbeelding en bewerking met
referentieafbeeldingen. Gebruik image voor één referentie of images voor
meerdere referenties. Door de provider ondersteunde uitvoerhints zoals
quality, outputFormat en background worden doorgestuurd wanneer
beschikbaar en als genegeerd gerapporteerd wanneer een provider ze niet
ondersteunt. Meegeleverde ondersteuning voor transparante achtergrond is
OpenAI-specifiek; andere providers kunnen nog steeds PNG-alfa behouden als hun
backend dit uitvoert.
Ondersteunde providers
| Provider | Standaardmodel | Bewerkingsondersteuning | Auth |
|---|---|---|---|
| ComfyUI | workflow |
Ja (1 afbeelding, geconfigureerd via workflow) | COMFY_API_KEY of COMFY_CLOUD_API_KEY voor cloud |
| DeepInfra | black-forest-labs/FLUX-1-schnell |
Ja (1 afbeelding) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev |
Ja (modelspecifieke limieten) | FAL_KEY |
gemini-3.1-flash-image-preview |
Ja | GEMINI_API_KEY of GOOGLE_API_KEY |
|
| LiteLLM | gpt-image-2 |
Ja (tot 5 invoerafbeeldingen) | LITELLM_API_KEY |
| MiniMax | image-01 |
Ja (onderwerpreferentie) | MINIMAX_API_KEY of MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 |
Ja (tot 4 afbeeldingen) | OPENAI_API_KEY of OpenAI Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview |
Ja (tot 5 invoerafbeeldingen) | OPENROUTER_API_KEY |
| Vydra | grok-imagine |
Nee | VYDRA_API_KEY |
| xAI | grok-imagine-image |
Ja (tot 5 afbeeldingen) | XAI_API_KEY |
Gebruik action: "list" om beschikbare providers en modellen tijdens runtime te
inspecteren:
/tool image_generate action=listProvidermogelijkheden
| Mogelijkheid | ComfyUI | DeepInfra | fal | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|
| Genereren (max. aantal) | Door workflow bepaald | 4 | 4 | 4 | 9 | 4 | 1 | 4 |
| Bewerken / referentie | 1 afbeelding (workflow) | 1 afbeelding | Flux: 1; GPT: 10; NB2: 14 | Tot 5 afbeeldingen | 1 afbeelding (onderwerpreferentie) | Tot 5 afbeeldingen | - | Tot 5 afbeeldingen |
| Grootteregeling | - | ✓ | ✓ | ✓ | - | Tot 4K | - | - |
| Beeldverhouding | - | - | ✓ | ✓ | ✓ | - | - | ✓ |
| Resolutie (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | 1K, 2K |
Toolparameters
promptstringrequiredPrompt voor afbeeldingsgeneratie. Vereist voor action: "generate".
action"generate" | "list"default: generateGebruik "list" om beschikbare providers en modellen tijdens runtime te inspecteren.
modelstringProvider-/modeloverride (bijv. openai/gpt-image-2). Gebruik
openai/gpt-image-1.5 voor transparante OpenAI-achtergronden.
imagestringPad of URL van één referentieafbeelding voor bewerkingsmodus.
imagesstring[]Meerdere referentieafbeeldingen voor bewerkingsmodus (tot 5 bij ondersteunende providers).
sizestringGroottehint: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.
aspectRatiostringBeeldverhouding: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.
resolution"1K" | "2K" | "4K"quality"low" | "medium" | "high" | "auto"Kwaliteitshint wanneer de provider dit ondersteunt.
outputFormat"png" | "jpeg" | "webp"Hint voor uitvoerindeling wanneer de provider dit ondersteunt.
background"transparent" | "opaque" | "auto"Achtergrondhint wanneer de provider dit ondersteunt. Gebruik transparent met
outputFormat: "png" of "webp" voor providers die transparantie ondersteunen.
countnumbertimeoutMsnumberOptionele time-out voor providerverzoeken in milliseconden. Wanneer Codex
image_generate via dynamische tools aanroept, overschrijft deze waarde per
aanroep nog steeds de geconfigureerde standaardwaarde en wordt deze begrensd
op 600000 ms.
filenamestringopenaiobjectAlleen-OpenAI-hints: background, moderation, outputCompression en user.
Configuratie
Modelselectie
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2", timeoutMs: 180_000, fallbacks: [ "openrouter/google/gemini-3.1-flash-image-preview", "google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev", ], }, }, },}Volgorde van providerselectie
OpenClaw probeert providers in deze volgorde:
- Parameter
modeluit de toolaanroep (als de agent er een opgeeft). imageGenerationModel.primaryuit de configuratie.imageGenerationModel.fallbacksop volgorde.- Autodetectie: alleen standaardproviders met auth:
- huidige standaardprovider eerst;
- resterende geregistreerde providers voor afbeeldingsgeneratie op volgorde van provider-id.
Als een provider faalt (auth-fout, rate limit, enz.), wordt automatisch de volgende geconfigureerde kandidaat geprobeerd. Als alles faalt, bevat de fout details van elke poging.
Per-call model overrides are exact
Een model-override per aanroep probeert alleen die provider/dat model en
gaat niet door naar geconfigureerde primaire/fallback-providers of
automatisch gedetecteerde providers.
Auto-detection is auth-aware
Een providerstandaard komt alleen in de kandidatenlijst wanneer OpenClaw
die provider daadwerkelijk kan authenticeren. Stel
agents.defaults.mediaGenerationAutoProviderFallback: false in om alleen
expliciete items voor model, primary en fallbacks te gebruiken.
Timeouts
Stel agents.defaults.imageGenerationModel.timeoutMs in voor langzame
afbeeldingsbackends. Een toolparameter timeoutMs per aanroep overschrijft
de geconfigureerde standaardwaarde. Dynamische-toolaanroepen van Codex
respecteren hetzelfde time-outbudget, begrensd door het maximum van 600000
ms van de dynamische-toolbridge van OpenClaw.
Inspect at runtime
Gebruik action: "list" om de momenteel geregistreerde providers, hun
standaardmodellen en hints voor auth-omgevingsvariabelen te inspecteren.
Afbeeldingen bewerken
OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI en xAI ondersteunen het bewerken van referentieafbeeldingen. Geef een pad of URL van een referentieafbeelding door:
"Genereer een aquarelversie van deze foto" + image: "/path/to/photo.jpg"OpenAI, OpenRouter, Google en xAI ondersteunen maximaal 5 referentieafbeeldingen via de
parameter images. fal ondersteunt 1 referentieafbeelding voor Flux image-to-image, tot
10 voor GPT Image 2-bewerkingen en tot 14 voor Nano Banana 2-bewerkingen. MiniMax en
ComfyUI ondersteunen er 1.
Diepgaande provideruitleg
OpenAI gpt-image-2 (and gpt-image-1.5)
OpenAI-afbeeldingsgeneratie gebruikt standaard openai/gpt-image-2. Als een
OAuth-profiel voor openai-codex is geconfigureerd, hergebruikt OpenClaw hetzelfde
OAuth-profiel dat door Codex-abonnementchatmodellen wordt gebruikt en stuurt het
de afbeeldingsaanvraag via de Codex Responses-backend. Verouderde Codex-basis-URL's
zoals https://chatgpt.com/backend-api worden voor afbeeldingsaanvragen gecanonicaliseerd naar
https://chatgpt.com/backend-api/codex. OpenClaw valt voor die aanvraag niet
stilzwijgend terug op OPENAI_API_KEY -
om directe routering via de OpenAI Images API af te dwingen, configureer je
models.providers.openai expliciet met een API-sleutel, aangepaste basis-URL
of Azure-eindpunt.
De modellen openai/gpt-image-1.5, openai/gpt-image-1 en
openai/gpt-image-1-mini kunnen nog steeds expliciet worden geselecteerd. Gebruik
gpt-image-1.5 voor PNG/WebP-uitvoer met transparante achtergrond; de huidige
gpt-image-2-API weigert background: "transparent".
gpt-image-2 ondersteunt zowel tekst-naar-afbeeldinggeneratie als
bewerking met referentieafbeeldingen via dezelfde tool image_generate.
OpenClaw stuurt prompt, count, size, quality, outputFormat
en referentieafbeeldingen door naar OpenAI. OpenAI ontvangt
aspectRatio of resolution niet rechtstreeks; waar mogelijk zet OpenClaw
die om naar een ondersteunde size, anders meldt de tool ze als
genegeerde overrides.
OpenAI-specifieke opties staan onder het object openai:
{ "quality": "low", "outputFormat": "jpeg", "openai": { "background": "opaque", "moderation": "low", "outputCompression": 60, "user": "end-user-42" }}openai.background accepteert transparent, opaque of auto;
transparante uitvoer vereist outputFormat png of webp en een
OpenAI-afbeeldingsmodel dat transparantie ondersteunt. OpenClaw routeert standaard
aanvragen met gpt-image-2 voor transparante achtergronden naar gpt-image-1.5.
openai.outputCompression is van toepassing op JPEG/WebP-uitvoer.
De toplevel hint background is providerneutraal en wordt momenteel gekoppeld
aan hetzelfde OpenAI-aanvraagveld background wanneer de OpenAI-provider
is geselecteerd. Providers die geen achtergrondondersteuning declareren, retourneren
deze in ignoredOverrides in plaats van de niet-ondersteunde parameter te ontvangen.
Zie
Azure OpenAI-eindpunten
om OpenAI-afbeeldingsgeneratie via een Azure OpenAI-implementatie te routeren
in plaats van via api.openai.com.
OpenRouter image models
OpenRouter-afbeeldingsgeneratie gebruikt dezelfde OPENROUTER_API_KEY en
routeert via de chat completions image-API van OpenRouter. Selecteer
OpenRouter-afbeeldingsmodellen met het prefix openrouter/:
{ agents: { defaults: { imageGenerationModel: { primary: "openrouter/google/gemini-3.1-flash-image-preview", }, }, },}OpenClaw stuurt prompt, count, referentieafbeeldingen en
Gemini-compatibele hints voor aspectRatio / resolution door naar OpenRouter.
Huidige ingebouwde snelkoppelingen voor OpenRouter-afbeeldingsmodellen omvatten
google/gemini-3.1-flash-image-preview,
google/gemini-3-pro-image-preview en openai/gpt-5.4-image-2. Gebruik
action: "list" om te zien wat je geconfigureerde Plugin aanbiedt.
MiniMax dual-auth
MiniMax-afbeeldingsgeneratie is beschikbaar via beide gebundelde MiniMax- authenticatiepaden:
minimax/image-01voor configuraties met API-sleutelminimax-portal/image-01voor OAuth-configuraties
xAI grok-imagine-image
De gebundelde xAI-provider gebruikt /v1/images/generations voor aanvragen
met alleen een prompt en /v1/images/edits wanneer image of images aanwezig is.
- Modellen:
xai/grok-imagine-image,xai/grok-imagine-image-pro - Aantal: maximaal 4
- Referenties: één
imageof maximaal vijfimages - Beeldverhoudingen:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Resoluties:
1K,2K - Uitvoer: geretourneerd als door OpenClaw beheerde afbeeldingsbijlagen
OpenClaw stelt xAI-eigen quality, mask,
user of extra, alleen native beeldverhoudingen bewust niet beschikbaar
totdat die besturingselementen bestaan in het gedeelde cross-providercontract
image_generate.
Voorbeelden
Generate (4K landscape)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1Generate (transparent PNG)
/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparentEquivalente CLI:
openclaw infer image generate \--model openai/gpt-image-1.5 \--output-format png \--background transparent \--prompt "A simple red circle sticker on a transparent background" \--jsonGenerate (two square)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2Edit (one reference)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536Edit (multiple references)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024Dezelfde vlaggen --output-format en --background zijn beschikbaar op
openclaw infer image edit; --openai-background blijft beschikbaar als
OpenAI-specifieke alias. Gebundelde providers anders dan OpenAI declareren
momenteel geen expliciete achtergrondbesturing, dus background: "transparent" wordt
voor hen als genegeerd gemeld.
Gerelateerd
- Tooloverzicht - alle beschikbare agenttools
- ComfyUI - configuratie van lokale ComfyUI- en Comfy Cloud-workflows
- fal - configuratie van fal-afbeeldings- en videoprovider
- Google (Gemini) - configuratie van Gemini-afbeeldingsprovider
- MiniMax - configuratie van MiniMax-afbeeldingsprovider
- OpenAI - configuratie van OpenAI Images-provider
- Vydra - configuratie van Vydra voor afbeeldingen, video en spraak
- xAI - configuratie van Grok voor afbeeldingen, video, zoeken, code-uitvoering en TTS
- Configuratiereferentie -
imageGenerationModel-configuratie - Modellen - modelconfiguratie en failover