Providers
xAI
OpenClaw には、Grok モデル用のバンドル済み xai provider plugin が同梱されています。
はじめに
API キーを作成する
xAI console で API キーを作成します。
API キーを設定する
XAI_API_KEY を設定するか、次を実行します。
openclaw onboard --auth-choice xai-api-keyモデルを選択する
{ agents: { defaults: { model: { primary: "xai/grok-4.3" } } },}組み込みカタログ
OpenClaw には、これらの xAI モデルファミリーが標準で含まれています。
| ファミリー | モデル ID |
|---|---|
| Grok 3 | grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast |
| Grok 4.3 | grok-4.3 |
| Grok 4 | grok-4, grok-4-0709 |
| Grok 4 Fast | grok-4-fast, grok-4-fast-non-reasoning |
| Grok 4.1 Fast | grok-4-1-fast, grok-4-1-fast-non-reasoning |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
| Grok Code | grok-code-fast-1 |
この plugin は、同じ API 形状に従う新しい grok-4* と grok-code-fast* の ID も前方解決します。
OpenClaw の機能対応範囲
バンドル済み plugin は、xAI の現在の公開 API サーフェスを OpenClaw の共有 provider およびツール契約にマッピングします。共有契約に適合しない機能 (たとえばストリーミング TTS やリアルタイム音声)は公開されません。下の表を参照してください。
| xAI の機能 | OpenClaw サーフェス | ステータス |
|---|---|---|
| Chat / Responses | xai/<model> model provider |
対応 |
| サーバー側 web search | web_search provider grok |
対応 |
| サーバー側 X search | x_search tool |
対応 |
| サーバー側コード実行 | code_execution tool |
対応 |
| 画像 | image_generate |
対応 |
| 動画 | video_generate |
対応 |
| バッチ text-to-speech | messages.tts.provider: "xai" / tts |
対応 |
| ストリーミング TTS | - | 非公開。OpenClaw の TTS 契約は完全な音声バッファを返します |
| バッチ speech-to-text | tools.media.audio / メディア理解 |
対応 |
| ストリーミング speech-to-text | Voice Call streaming.provider: "xai" |
対応 |
| リアルタイム音声 | - | まだ非公開。別のセッション/WebSocket 契約です |
| ファイル / バッチ | 汎用 model API 互換性のみ | ファーストクラスの OpenClaw ツールではありません |
Fast-mode のマッピング
/fast on または agents.defaults.models["xai/<model>"].params.fastMode: true
は、ネイティブ xAI リクエストを次のように書き換えます。
| ソースモデル | Fast-mode ターゲット |
|---|---|
grok-3 |
grok-3-fast |
grok-3-mini |
grok-3-mini-fast |
grok-4 |
grok-4-fast |
grok-4-0709 |
grok-4-fast |
レガシー互換エイリアス
レガシーエイリアスは、引き続き正規のバンドル済み ID に正規化されます。
| レガシーエイリアス | 正規 ID |
|---|---|
grok-4-fast-reasoning |
grok-4-fast |
grok-4-1-fast-reasoning |
grok-4-1-fast |
grok-4.20-reasoning |
grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning |
grok-4.20-beta-latest-non-reasoning |
機能
Web search
バンドル済みの grok web-search provider は、XAI_API_KEY または plugin の
web-search キーを使用できます。
openclaw config set tools.web.search.provider grok動画生成
バンドル済みの xai plugin は、共有 video_generate ツールを通じて動画生成を登録します。
- デフォルトの動画モデル:
xai/grok-imagine-video - モード: text-to-video、image-to-video、reference-image 生成、リモート動画編集、リモート動画延長
- アスペクト比:
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - 解像度:
480P,720P - 長さ: 生成/image-to-video は 1〜15 秒、
reference_imageロールの使用時は 1〜10 秒、延長は 2〜10 秒 - Reference-image 生成: すべての提供画像に
imageRolesをreference_imageとして設定します。xAI はそのような画像を最大 7 枚受け付けます
xAI をデフォルトの動画 provider として使用するには:
{ agents: { defaults: { videoGenerationModel: { primary: "xai/grok-imagine-video", }, }, },}画像生成
バンドル済みの xai plugin は、共有 image_generate ツールを通じて画像生成を登録します。
- デフォルトの画像モデル:
xai/grok-imagine-image - 追加モデル:
xai/grok-imagine-image-pro - モード: text-to-image と reference-image edit
- 参照入力: 1 つの
image、または最大 5 つのimages - アスペクト比:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - 解像度:
1K,2K - 件数: 最大 4 画像
OpenClaw は xAI に b64_json 画像レスポンスを要求します。これにより、生成されたメディアを通常のチャンネル添付パスを通じて保存および配信できます。ローカル参照画像は data URL に変換されます。リモート http(s) 参照はそのまま渡されます。
xAI をデフォルトの画像 provider として使用するには:
{ agents: { defaults: { imageGenerationModel: { primary: "xai/grok-imagine-image", }, }, },}Text-to-speech
バンドル済みの xai plugin は、共有 tts provider サーフェスを通じて text-to-speech を登録します。
- 音声:
eve,ara,rex,sal,leo,una - デフォルト音声:
eve - 形式:
mp3,wav,pcm,mulaw,alaw - 言語: BCP-47 コードまたは
auto - 速度: provider ネイティブの速度オーバーライド
- ネイティブ Opus 音声メモ形式はサポートされていません
xAI をデフォルトの TTS provider として使用するには:
{ messages: { tts: { provider: "xai", providers: { xai: { voiceId: "eve", }, }, }, },}Speech-to-text
バンドル済みの xai plugin は、OpenClaw のメディア理解文字起こしサーフェスを通じてバッチ speech-to-text を登録します。
- デフォルトモデル:
grok-stt - エンドポイント: xAI REST
/v1/stt - 入力パス: multipart 音声ファイルアップロード
- OpenClaw では、Discord 音声チャンネルセグメントやチャンネル音声添付を含め、インバウンド音声文字起こしが
tools.media.audioを使用する場所でサポートされます
インバウンド音声文字起こしに xAI を強制するには:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "xai", model: "grok-stt", }, ], }, }, },}言語は、共有音声メディア config または呼び出しごとの文字起こしリクエストを通じて指定できます。プロンプトヒントは共有 OpenClaw サーフェスで受け付けられますが、xAI REST STT 統合は、現在の公開 xAI エンドポイントにきれいに対応する file、model、language のみを転送します。
ストリーミング speech-to-text
バンドル済みの xai plugin は、ライブ音声通話音声用のリアルタイム文字起こし provider も登録します。
- エンドポイント: xAI WebSocket
wss://api.x.ai/v1/stt - デフォルトエンコーディング:
mulaw - デフォルトサンプルレート:
8000 - デフォルトエンドポイント判定:
800ms - 暫定トランスクリプト: デフォルトで有効
Voice Call の Twilio メディアストリームは G.711 µ-law 音声フレームを送信するため、 xAI provider はトランスコードせずにそれらのフレームを直接転送できます。
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "xai", providers: { xai: { apiKey: "${XAI_API_KEY}", endpointingMs: 800, language: "en", }, }, }, }, }, }, },}プロバイダーが所有する設定は
plugins.entries.voice-call.config.streaming.providers.xai の下にあります。サポートされる
キーは apiKey、baseUrl、sampleRate、encoding(pcm、mulaw、または
alaw)、interimResults、endpointingMs、language です。
x_search 設定
バンドルされた xAI Plugin は、Grok 経由で X(旧 Twitter)のコンテンツを検索する
OpenClaw ツールとして x_search を公開します。
設定パス: plugins.entries.xai.config.xSearch
| キー | 型 | デフォルト | 説明 |
|---|---|---|---|
enabled |
boolean | - | x_search を有効または無効にする |
model |
string | grok-4-1-fast |
x_search リクエストに使用するモデル |
baseUrl |
string | - | xAI Responses ベース URL の上書き |
inlineCitations |
boolean | - | 結果にインライン引用を含める |
maxTurns |
number | - | 最大会話ターン数 |
timeoutSeconds |
number | - | リクエストのタイムアウト秒数 |
cacheTtlMinutes |
number | - | キャッシュの有効期間(分) |
{ plugins: { entries: { xai: { config: { xSearch: { enabled: true, model: "grok-4-1-fast", baseUrl: "https://api.x.ai/v1", inlineCitations: true, }, }, }, }, },}コード実行設定
バンドルされた xAI Plugin は、xAI のサンドボックス環境でリモートコード実行を行う
OpenClaw ツールとして code_execution を公開します。
設定パス: plugins.entries.xai.config.codeExecution
| キー | 型 | デフォルト | 説明 |
|---|---|---|---|
enabled |
boolean | true(キーが利用可能な場合) |
コード実行を有効または無効にする |
model |
string | grok-4-1-fast |
コード実行リクエストに使用するモデル |
maxTurns |
number | - | 最大会話ターン数 |
timeoutSeconds |
number | - | リクエストのタイムアウト秒数 |
{ plugins: { entries: { xai: { config: { codeExecution: { enabled: true, model: "grok-4-1-fast", }, }, }, }, },}既知の制限
- 認証は現在 API キーのみです。API キーは xAI 認証 プロファイル、環境変数、または Plugin 設定に保存できます。OpenClaw にはまだ xAI OAuth や デバイスコードフローはありません。
grok-4.20-multi-agent-experimental-beta-0304は、通常の xAI プロバイダーパスでは サポートされていません。標準の OpenClaw xAI トランスポートとは異なる上流 API サーフェスが必要なためです。- xAI Realtime 音声は、まだ OpenClaw プロバイダーとして登録されていません。バッチ STT や ストリーミング文字起こしとは異なる双方向音声セッション契約が必要です。
- xAI 画像の
quality、画像mask、および追加のネイティブ専用アスペクト比は、 共有image_generateツールに対応するクロスプロバイダー制御が追加されるまで公開されません。
高度なメモ
- OpenClaw は、共有ランナーパスで xAI 固有のツールスキーマおよびツール呼び出し互換性修正を 自動的に適用します。
- ネイティブ xAI リクエストはデフォルトで
tool_stream: trueです。無効にするにはagents.defaults.models["xai/<model>"].params.tool_streamをfalseに設定します。 - バンドルされた xAI ラッパーは、ネイティブ xAI リクエストを送信する前に、サポートされていない strict ツールスキーマフラグと reasoning ペイロードキーを取り除きます。
web_search、x_search、code_executionは OpenClaw ツールとして公開されます。OpenClaw は、すべてのネイティブツールを各チャットターンに付加するのではなく、 各ツールリクエスト内で必要な特定の xAI 組み込み機能を有効にします。- Grok
web_searchはplugins.entries.xai.config.webSearch.baseUrlを読み取ります。x_searchはplugins.entries.xai.config.xSearch.baseUrlを読み取り、その後 Grok web-search ベース URL にフォールバックします。 x_searchとcode_executionは、コアモデルランタイムにハードコードされるのではなく、 バンドルされた xAI Plugin が所有します。code_executionはリモートの xAI サンドボックス実行であり、ローカルのexecではありません。
ライブテスト
xAI メディアパスは、ユニットテストとオプトインのライブスイートでカバーされています。ライブ
コマンドは、XAI_API_KEY をプローブする前に、~/.profile を含むログインシェルから
シークレットを読み込みます。
pnpm test extensions/xaiOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.tsOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.tsプロバイダー固有のライブファイルは、通常の TTS、電話向け PCM TTS を合成し、xAI バッチ STT で音声を文字起こしし、同じ PCM を xAI リアルタイム STT でストリーミングし、text-to-image 出力を生成し、参照画像を編集します。共有 画像ライブファイルは、OpenClaw の ランタイム選択、フォールバック、正規化、メディア添付パスを通じて、同じ xAI プロバイダーを検証します。