---
read_when:
    - エージェント経由で動画を生成する
    - 動画生成プロバイダーとモデルの設定
    - video_generate ツールのパラメータを理解する
sidebarTitle: Video generation
summary: 16のプロバイダーバックエンドにわたり、テキスト、画像、または動画参照から video_generate 経由で動画を生成します
title: 動画生成
x-i18n:
    generated_at: "2026-05-11T20:40:05Z"
    model: gpt-5.5
    provider: openai
    source_hash: 1f1dbeea0393150c1495bcc0a9acc68a57b99d919f3134fb17820f22cfe05e90
    source_path: tools/video-generation.md
    workflow: 16
---

OpenClaw エージェントは、テキストプロンプト、参照画像、または
既存の動画から動画を生成できます。16 個のプロバイダーバックエンドがサポートされており、それぞれ
異なるモデルオプション、入力モード、機能セットを持ちます。エージェントは、設定と利用可能な API
キーに基づいて、適切なプロバイダーを自動的に選択します。

<Note>
`video_generate` ツールは、少なくとも 1 つの動画生成
プロバイダーが利用可能な場合にのみ表示されます。エージェントツールに表示されない場合は、
プロバイダー API キーを設定するか、`agents.defaults.videoGenerationModel` を構成してください。
</Note>

OpenClaw は動画生成を 3 つのランタイムモードとして扱います。

- `generate` - 参照メディアなしのテキストから動画へのリクエスト。
- `imageToVideo` - リクエストに 1 つ以上の参照画像が含まれます。
- `videoToVideo` - リクエストに 1 つ以上の参照動画が含まれます。

プロバイダーは、これらのモードの任意のサブセットをサポートできます。ツールは送信前に
アクティブなモードを検証し、`action=list` でサポートされているモードを報告します。

## クイックスタート

<Steps>
  <Step title="認証を構成">
    サポートされている任意のプロバイダーの API キーを設定します。

    ```bash
    export GEMINI_API_KEY="your-key"
    ```

  </Step>
  <Step title="デフォルトモデルを選択（任意）">
    ```bash
    openclaw config set agents.defaults.videoGenerationModel.primary "google/veo-3.1-fast-generate-preview"
    ```
  </Step>
  <Step title="エージェントに依頼">
    > 夕暮れにサーフィンをする親しみやすいロブスターの、5 秒間の映画的な動画を生成してください。

    エージェントは `video_generate` を自動的に呼び出します。ツールの許可リスト登録は
    必要ありません。

  </Step>
</Steps>

## 非同期生成の仕組み

動画生成は非同期です。エージェントがセッション内で `video_generate` を呼び出すと:

1. OpenClaw はリクエストをプロバイダーに送信し、すぐにタスク ID を返します。
2. プロバイダーはバックグラウンドでジョブを処理します（通常はプロバイダーと解像度に応じて 30 秒から数分。キューに支えられた低速なプロバイダーでは、設定されたタイムアウトまで実行される場合があります）。
3. 動画の準備ができると、OpenClaw は内部完了イベントで同じセッションを起動します。
4. エージェントはユーザーに通知し、完成した動画を添付します。メッセージツールのみの可視配信を使用するグループ/チャンネル
   チャットでは、OpenClaw が直接投稿する代わりに、エージェントがメッセージツールを通じて
   結果を中継します。

ジョブが実行中の間、同じセッション内で重複する `video_generate` 呼び出しは、別の
生成を開始する代わりに現在のタスクステータスを返します。CLI から進捗を確認するには、
`openclaw tasks list` または `openclaw tasks show <taskId>` を使用します。

セッションに支えられたエージェント実行の外部（たとえば、直接のツール呼び出し）では、
ツールはインライン生成にフォールバックし、同じターンで最終メディアパスを
返します。

生成された動画ファイルは、プロバイダーがバイトを返す場合、OpenClaw 管理のメディアストレージの下に保存されます。
デフォルトの生成動画保存上限は動画メディア制限に従い、`agents.defaults.mediaMaxMb` は
より大きなレンダーのためにそれを引き上げます。プロバイダーがホストされた出力 URL も返す場合、ローカル永続化が
サイズ超過ファイルを拒否したときに、OpenClaw はタスクを失敗させる代わりにその URL を配信できます。

### タスクライフサイクル

| 状態        | 意味                                                                                                      |
| ----------- | --------------------------------------------------------------------------------------------------------- |
| `queued`    | タスクが作成され、プロバイダーによる受け入れを待っています。                                             |
| `running`   | プロバイダーが処理中です（通常はプロバイダーと解像度に応じて 30 秒から数分）。                            |
| `succeeded` | 動画の準備ができました。エージェントが起動し、会話に投稿します。                                         |
| `failed`    | プロバイダーエラーまたはタイムアウトです。エージェントがエラー詳細とともに起動します。                   |

CLI からステータスを確認します。

```bash
openclaw tasks list
openclaw tasks show <taskId>
openclaw tasks cancel <taskId>
```

現在のセッションに対して動画タスクがすでに `queued` または `running` の場合、
`video_generate` は新しいタスクを開始する代わりに既存のタスクステータスを返します。
新しい生成をトリガーせずに明示的に確認するには、`action: "status"` を使用します。

## サポートされているプロバイダー

| プロバイダー          | デフォルトモデル                | テキスト | 画像参照                                             | 動画参照                                        | 認証                                     |
| --------------------- | ------------------------------- | :------: | ---------------------------------------------------- | ----------------------------------------------- | ---------------------------------------- |
| Alibaba               | `wan2.6-t2v`                    |    ✓     | はい（リモート URL）                                 | はい（リモート URL）                            | `MODELSTUDIO_API_KEY`                    |
| BytePlus (1.0)        | `seedance-1-0-pro-250528`       |    ✓     | 最大 2 枚の画像（I2V モデルのみ。最初 + 最後のフレーム） | -                                               | `BYTEPLUS_API_KEY`                       |
| BytePlus Seedance 1.5 | `seedance-1-5-pro-251215`       |    ✓     | 最大 2 枚の画像（ロール経由の最初 + 最後のフレーム） | -                                               | `BYTEPLUS_API_KEY`                       |
| BytePlus Seedance 2.0 | `dreamina-seedance-2-0-260128`  |    ✓     | 最大 9 枚の参照画像                                  | 最大 3 本の動画                                 | `BYTEPLUS_API_KEY`                       |
| ComfyUI               | `workflow`                      |    ✓     | 1 枚の画像                                           | -                                               | `COMFY_API_KEY` または `COMFY_CLOUD_API_KEY` |
| DeepInfra             | `Pixverse/Pixverse-T2V`         |    ✓     | -                                                    | -                                               | `DEEPINFRA_API_KEY`                      |
| fal                   | `fal-ai/minimax/video-01-live`  |    ✓     | 1 枚の画像。Seedance reference-to-video では最大 9 枚 | Seedance reference-to-video では最大 3 本の動画 | `FAL_KEY`                                |
| Google                | `veo-3.1-fast-generate-preview` |    ✓     | 1 枚の画像                                           | 1 本の動画                                      | `GEMINI_API_KEY`                         |
| MiniMax               | `MiniMax-Hailuo-2.3`            |    ✓     | 1 枚の画像                                           | -                                               | `MINIMAX_API_KEY` または MiniMax OAuth   |
| OpenAI                | `sora-2`                        |    ✓     | 1 枚の画像                                           | 1 本の動画                                      | `OPENAI_API_KEY`                         |
| OpenRouter            | `google/veo-3.1-fast`           |    ✓     | 最大 4 枚の画像（最初/最後のフレームまたは参照）     | -                                               | `OPENROUTER_API_KEY`                     |
| Qwen                  | `wan2.6-t2v`                    |    ✓     | はい（リモート URL）                                 | はい（リモート URL）                            | `QWEN_API_KEY`                           |
| Runway                | `gen4.5`                        |    ✓     | 1 枚の画像                                           | 1 本の動画                                      | `RUNWAYML_API_SECRET`                    |
| Together              | `Wan-AI/Wan2.2-T2V-A14B`        |    ✓     | 1 枚の画像                                           | -                                               | `TOGETHER_API_KEY`                       |
| Vydra                 | `veo3`                          |    ✓     | 1 枚の画像（`kling`）                                | -                                               | `VYDRA_API_KEY`                          |
| xAI                   | `grok-imagine-video`            |    ✓     | 1 枚の最初のフレーム画像、または最大 7 個の `reference_image` | 1 本の動画                                      | `XAI_API_KEY`                            |

一部のプロバイダーは、追加または代替の API キー環境変数を受け入れます。詳細は
個別の[プロバイダーページ](#related)を参照してください。

実行時に利用可能なプロバイダー、モデル、ランタイムモードを調べるには、`video_generate action=list` を実行します。

### 機能マトリクス

`video_generate`、コントラクトテスト、共有ライブスイープで使用される明示的なモードコントラクト:

| プロバイダー | `generate` | `imageToVideo` | `videoToVideo` | 現在の共有ライブレーン                                                                                                                   |
| ------------ | :--------: | :------------: | :------------: | ---------------------------------------------------------------------------------------------------------------------------------------- |
| Alibaba      |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; このプロバイダーはリモート `http(s)` 動画 URL を必要とするため、`videoToVideo` はスキップされます            |
| BytePlus     |     ✓      |       ✓        |       -        | `generate`, `imageToVideo`                                                                                                               |
| ComfyUI      |     ✓      |       ✓        |       -        | 共有スイープには含まれません。ワークフロー固有のカバレッジは Comfy テスト側にあります                                                    |
| DeepInfra    |     ✓      |       -        |       -        | `generate`; ネイティブ DeepInfra 動画スキーマはバンドルされたコントラクト内ではテキストから動画です                                      |
| fal          |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; `videoToVideo` は Seedance reference-to-video を使用する場合のみ                                              |
| Google       |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; 現在のバッファーに支えられた Gemini/Veo スイープがその入力を受け入れないため、共有 `videoToVideo` はスキップされます |
| MiniMax      |     ✓      |       ✓        |       -        | `generate`, `imageToVideo`                                                                                                               |
| OpenAI       |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; この org/入力パスは現在プロバイダー側の inpaint/remix アクセスを必要とするため、共有 `videoToVideo` はスキップされます |
| OpenRouter   |     ✓      |       ✓        |       -        | `generate`, `imageToVideo`                                                                                                               |
| Qwen         |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; このプロバイダーはリモート `http(s)` 動画 URL を必要とするため、`videoToVideo` はスキップされます            |
| Runway       |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; `videoToVideo` は選択されたモデルが `runway/gen4_aleph` の場合のみ実行されます                               |
| Together     |     ✓      |       ✓        |       -        | `generate`, `imageToVideo`                                                                                                               |
| Vydra        |     ✓      |       ✓        |       -        | `generate`; バンドルされた `veo3` はテキスト専用で、バンドルされた `kling` はリモート画像 URL を必要とするため、共有 `imageToVideo` はスキップされます |
| xAI          |     ✓      |       ✓        |       ✓        | `generate`, `imageToVideo`; このプロバイダーは現在リモート MP4 URL を必要とするため、`videoToVideo` はスキップされます                   |

## ツールパラメーター

### 必須

<ParamField path="prompt" type="string" required>
  生成する動画のテキスト説明。`action: "generate"` には必須です。
</ParamField>

### コンテンツ入力

<ParamField path="image" type="string">単一の参照画像（パスまたは URL）。</ParamField>
<ParamField path="images" type="string[]">複数の参照画像（最大 9 個）。</ParamField>
<ParamField path="imageRoles" type="string[]">
結合された画像リストと並行する、位置ごとの任意のロールヒント。
正規値: `first_frame`, `last_frame`, `reference_image`。
</ParamField>
<ParamField path="video" type="string">単一の参照動画（パスまたは URL）。</ParamField>
<ParamField path="videos" type="string[]">複数の参照動画（最大 4 個）。</ParamField>
<ParamField path="videoRoles" type="string[]">
結合された動画リストと並行する、位置ごとの任意のロールヒント。
正規値: `reference_video`。
</ParamField>
<ParamField path="audioRef" type="string">
単一の参照音声（パスまたは URL）。プロバイダーが音声入力をサポートする場合に、
BGM または音声参照に使用されます。
</ParamField>
<ParamField path="audioRefs" type="string[]">複数の参照音声（最大 3 個）。</ParamField>
<ParamField path="audioRoles" type="string[]">
結合された音声リストと並行する、位置ごとの任意のロールヒント。
正規値: `reference_audio`。
</ParamField>

<Note>
ロールヒントはそのままプロバイダーに転送されます。正規値は
`VideoGenerationAssetRole` union から来ていますが、プロバイダーは追加の
ロール文字列を受け入れる場合があります。`*Roles` 配列のエントリ数は、対応する
参照リストを超えてはいけません。1 つずれのミスは明確なエラーで失敗します。
スロットを未設定のままにするには空文字列を使用します。xAI では、その
`reference_images` 生成モードを使用するために、すべての画像ロールを
`reference_image` に設定します。単一画像の image-to-video では、ロールを省略するか
`first_frame` を使用します。
</Note>

### スタイル制御

<ParamField path="aspectRatio" type="string">
  `1:1`、`16:9`、`9:16`、`adaptive`、またはプロバイダー固有の値などのアスペクト比ヒント。OpenClaw は、プロバイダーごとに未サポートの値を正規化または無視します。
</ParamField>
<ParamField path="resolution" type="string">`480P`、`720P`、`768P`、`1080P`、`4K`、またはプロバイダー固有の値などの解像度ヒント。OpenClaw は、プロバイダーごとに未サポートの値を正規化または無視します。</ParamField>
<ParamField path="durationSeconds" type="number">
  目標 duration（秒）（プロバイダーがサポートする最も近い値に丸められます）。
</ParamField>
<ParamField path="size" type="string">プロバイダーがサポートする場合のサイズヒント。</ParamField>
<ParamField path="audio" type="boolean">
  サポートされている場合、出力で生成音声を有効にします。`audioRef*`（入力）とは別です。
</ParamField>
<ParamField path="watermark" type="boolean">サポートされている場合、プロバイダーのウォーターマークを切り替えます。</ParamField>

`adaptive` はプロバイダー固有の sentinel です。これは、機能で `adaptive` を宣言している
プロバイダーにそのまま転送されます（例: BytePlus
Seedance は入力画像の寸法から比率を自動検出するために使用します）。宣言していない
プロバイダーでは、値はツール結果の
`details.ignoredOverrides` 経由で表示されるため、破棄されたことが分かります。

### 高度な設定

<ParamField path="action" type='"generate" | "status" | "list"' default="generate">
  `"status"` は現在のセッションタスクを返します。`"list"` はプロバイダーを検査します。
</ParamField>
<ParamField path="model" type="string">プロバイダー/モデルのオーバーライド（例: `runway/gen4.5`）。</ParamField>
<ParamField path="filename" type="string">出力ファイル名のヒント。</ParamField>
<ParamField path="timeoutMs" type="number">任意のプロバイダー操作タイムアウト（ミリ秒）。省略した場合、OpenClaw は設定されていれば `agents.defaults.videoGenerationModel.timeoutMs` を使用します。</ParamField>
<ParamField path="providerOptions" type="object">
  JSON オブジェクトとしてのプロバイダー固有オプション（例: `{"seed": 42, "draft": true}`）。
  型付きスキーマを宣言するプロバイダーは、キーと型を検証します。不明な
  キーまたは不一致があると、フォールバック時にその候補はスキップされます。宣言されたスキーマがない
  プロバイダーは、オプションをそのまま受け取ります。各プロバイダーが受け入れる内容を確認するには
  `video_generate action=list` を実行します。
</ParamField>

<Note>
すべてのプロバイダーがすべてのパラメーターをサポートしているわけではありません。OpenClaw は duration を
プロバイダーがサポートする最も近い値に正規化し、フォールバックプロバイダーが異なる
制御サーフェスを公開している場合は、size-to-aspect-ratio などの変換済み geometry ヒントを再マップします。
本当にサポートされていないオーバーライドはベストエフォートで無視され、
ツール結果で警告として報告されます。厳格な機能制限
（参照入力が多すぎるなど）は送信前に失敗します。ツール結果は
適用された設定を報告します。`details.normalization` は、要求から適用値への
変換を記録します。
</Note>

参照入力はランタイムモードを選択します。

- 参照メディアなし → `generate`
- 任意の画像参照 → `imageToVideo`
- 任意の動画参照 → `videoToVideo`
- 参照音声入力は、解決されたモードを変更**しません**。画像/動画参照が選択した
  モードの上に適用され、`maxInputAudios` を宣言しているプロバイダーでのみ
  動作します。

画像参照と動画参照の混在は、安定した共有機能サーフェスではありません。
リクエストごとに参照タイプを 1 つにすることを推奨します。

#### フォールバックと型付きオプション

一部の機能チェックはツール境界ではなくフォールバックレイヤーで適用されるため、
プライマリプロバイダーの制限を超えるリクエストでも、
対応可能なフォールバックで実行できる場合があります。

- アクティブな候補が `maxInputAudios` を宣言していない（または `0`）場合、
  リクエストに音声参照が含まれているとスキップされ、次の候補が試行されます。
- アクティブな候補の `maxDurationSeconds` が要求された `durationSeconds` を下回り、
  宣言された `supportedDurationSeconds` リストがない場合 → スキップされます。
- リクエストに `providerOptions` が含まれ、アクティブな候補が型付き
  `providerOptions` スキーマを明示的に宣言している場合 → 指定されたキーが
  スキーマ内にない、または値の型が一致しないとスキップされます。宣言されたスキーマがない
  プロバイダーは、オプションをそのまま受け取ります（後方互換の
  パススルー）。プロバイダーは空のスキーマ（`capabilities.providerOptions: {}`）を
  宣言することで、すべてのプロバイダーオプションを拒否できます。その場合、
  型不一致と同じスキップが発生します。

リクエスト内の最初のスキップ理由は `warn` でログに記録されるため、オペレーターは
プライマリプロバイダーが見送られたことを確認できます。後続のスキップは `debug` でログに記録され、
長いフォールバックチェーンを静かに保ちます。すべての候補がスキップされた場合、
集約エラーにはそれぞれのスキップ理由が含まれます。

## アクション

| アクション | 実行内容                                                                                                 |
| ---------- | -------------------------------------------------------------------------------------------------------- |
| `generate` | デフォルト。指定されたプロンプトと任意の参照入力から動画を作成します。                                  |
| `status`   | 別の生成を開始せずに、現在のセッションで実行中の動画タスクの状態を確認します。                          |
| `list`     | 利用可能なプロバイダー、モデル、およびその機能を表示します。                                            |

## モデル選択

OpenClaw は次の順序でモデルを解決します。

1. **`model` ツールパラメーター** - agent が呼び出しで指定した場合。
2. 設定の **`videoGenerationModel.primary`**。
3. 順番に **`videoGenerationModel.fallbacks`**。
4. **自動検出** - 現在のデフォルトプロバイダーから開始し、その後、残りのプロバイダーをアルファベット順に、
   有効な認証を持つプロバイダー。

プロバイダーが失敗した場合、次の候補が自動的に試行されます。すべての
候補が失敗した場合、エラーには各試行の詳細が含まれます。

明示的な `model`、`primary`、`fallbacks` エントリのみを使用するには、
`agents.defaults.mediaGenerationAutoProviderFallback: false` を設定します。

```json5
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
        fallbacks: ["runway/gen4.5", "qwen/wan2.6-t2v"],
      },
    },
  },
}
```

## プロバイダーの注意事項

<AccordionGroup>
  <Accordion title="Alibaba">
    DashScope / Model Studio 非同期エンドポイントを使用します。参照画像と
    動画はリモートの `http(s)` URL である必要があります。
  </Accordion>
  <Accordion title="BytePlus (1.0)">
    プロバイダー ID: `byteplus`。

    モデル: `seedance-1-0-pro-250528`（デフォルト）、
    `seedance-1-0-pro-t2v-250528`、`seedance-1-0-pro-fast-251015`、
    `seedance-1-0-lite-t2v-250428`、`seedance-1-0-lite-i2v-250428`。

    T2V モデル（`*-t2v-*`）は画像入力を受け付けません。I2V モデルと
    汎用 `*-pro-*` モデルは、単一の参照画像（最初の
    フレーム）をサポートします。画像を位置指定で渡すか、`role: "first_frame"` を設定します。
    画像が指定されると、T2V モデル ID は対応する I2V
    バリアントに自動的に切り替わります。

    サポートされる `providerOptions` キー: `seed`（number）、`draft`（boolean -
    480p を強制）、`camera_fixed`（boolean）。

  </Accordion>
  <Accordion title="BytePlus Seedance 1.5">
    [`@openclaw/byteplus-modelark`](https://www.npmjs.com/package/@openclaw/byteplus-modelark)
    Plugin が必要です。プロバイダー ID: `byteplus-seedance15`。モデル:
    `seedance-1-5-pro-251215`。

    統合 `content[]` API を使用します。最大 2 つの入力画像
    （`first_frame` + `last_frame`）をサポートします。すべての入力はリモートの `https://`
    URL である必要があります。各画像に `role: "first_frame"` / `"last_frame"` を設定するか、
    画像を位置指定で渡します。

    `aspectRatio: "adaptive"` は入力画像から比率を自動検出します。
    `audio: true` は `generate_audio` にマップされます。`providerOptions.seed`
    （number）は転送されます。

  </Accordion>
  <Accordion title="BytePlus Seedance 2.0">
    [`@openclaw/byteplus-modelark`](https://www.npmjs.com/package/@openclaw/byteplus-modelark)
    Plugin が必要です。プロバイダー ID: `byteplus-seedance2`。モデル:
    `dreamina-seedance-2-0-260128`、
    `dreamina-seedance-2-0-fast-260128`。

    統合 `content[]` API を使用します。最大 9 個の参照画像、
    3 個の参照動画、3 個の参照音声をサポートします。すべての入力はリモートの
    `https://` URL である必要があります。各アセットに `role` を設定します - サポートされる値:
    `"first_frame"`、`"last_frame"`、`"reference_image"`、
    `"reference_video"`、`"reference_audio"`。

    `aspectRatio: "adaptive"` は入力画像から比率を自動検出します。
    `audio: true` は `generate_audio` にマップされます。`providerOptions.seed`
    （number）は転送されます。

  </Accordion>
  <Accordion title="ComfyUI">
    ワークフロー駆動のローカルまたはクラウド実行。設定されたグラフを通じて、テキストから動画と
    画像から動画をサポートします。
  </Accordion>
  <Accordion title="fal">
    長時間実行ジョブにはキューを使ったフローを使用します。OpenClaw はデフォルトで最大 20
    分待機した後、進行中の fal キュージョブをタイムアウトとして扱います。ほとんどの fal 動画モデルは
    単一の画像参照を受け付けます。Seedance 2.0 の参照から動画モデルは
    最大 9 個の画像、3 個の動画、3 個の音声参照を受け付け、参照ファイルの合計は
    最大 12 個です。
  </Accordion>
  <Accordion title="Google (Gemini / Veo)">
    1 つの画像または 1 つの動画参照をサポートします。生成音声リクエストは
    Gemini API パスでは警告付きで無視されます。その API は現在の Veo 動画生成で
    `generateAudio` パラメーターを拒否するためです。
  </Accordion>
  <Accordion title="MiniMax">
    単一の画像参照のみ。MiniMax は `768P` と `1080P`
    の解像度を受け付けます。`720P` などのリクエストは送信前に
    最も近い対応値へ正規化されます。
  </Accordion>
  <Accordion title="OpenAI">
    `size` オーバーライドのみが転送されます。その他のスタイルオーバーライド
    (`aspectRatio`, `resolution`, `audio`, `watermark`) は警告付きで
    無視されます。
  </Accordion>
  <Accordion title="OpenRouter">
    OpenRouter の非同期 `/videos` API を使用します。OpenClaw は
    ジョブを送信し、`polling_url` をポーリングして、`unsigned_urls` または
    ドキュメント化されたジョブコンテンツエンドポイントのいずれかをダウンロードします。バンドルされた `google/veo-3.1-fast` デフォルトは
    4/6/8 秒の長さ、`720P`/`1080P` の解像度、
    `16:9`/`9:16` のアスペクト比を公開しています。
  </Accordion>
  <Accordion title="Qwen">
    Alibaba と同じ DashScope バックエンドです。参照入力はリモートの
    `http(s)` URL である必要があります。ローカルファイルは事前に拒否されます。
  </Accordion>
  <Accordion title="Runway">
    data URI 経由でローカルファイルをサポートします。動画から動画には
    `runway/gen4_aleph` が必要です。テキストのみの実行では `16:9` と `9:16` のアスペクト
    比が公開されます。
  </Accordion>
  <Accordion title="Together">
    単一の画像参照のみ。
  </Accordion>
  <Accordion title="Vydra">
    認証が失われるリダイレクトを避けるため、`https://www.vydra.ai/api/v1` を直接使用します。
    `veo3` はテキストから動画のみとしてバンドルされています。`kling` には
    リモート画像 URL が必要です。
  </Accordion>
  <Accordion title="xAI">
    テキストから動画、単一の先頭フレーム画像から動画、xAI `reference_images` 経由で最大 7 個の
    `reference_image` 入力、およびリモートの
    動画編集/延長フローをサポートします。
  </Accordion>
</AccordionGroup>

## プロバイダー機能モード

共有の動画生成契約は、単なるフラットな集約上限ではなく、モード固有の機能をサポートします。
新しいプロバイダー実装では
明示的なモードブロックを優先してください。

```typescript
capabilities: {
  generate: {
    maxVideos: 1,
    maxDurationSeconds: 10,
    supportsResolution: true,
  },
  imageToVideo: {
    enabled: true,
    maxVideos: 1,
    maxInputImages: 1,
    maxInputImagesByModel: { "provider/reference-to-video": 9 },
    maxDurationSeconds: 5,
  },
  videoToVideo: {
    enabled: true,
    maxVideos: 1,
    maxInputVideos: 1,
    maxDurationSeconds: 5,
  },
}
```

`maxInputImages` や `maxInputVideos` などのフラットな集約フィールドだけでは、
変換モード対応を示すには
**不十分**です。ライブテスト、契約テスト、共有 `video_generate` ツールが
モード対応を決定的に検証できるように、プロバイダーは
`generate`、`imageToVideo`、`videoToVideo` を明示的に宣言する必要があります。

プロバイダー内の 1 つのモデルが他よりも広い参照入力対応を持つ場合は、
モード全体の上限を引き上げるのではなく、`maxInputImagesByModel`、`maxInputVideosByModel`、または
`maxInputAudiosByModel` を使用してください。

## ライブテスト

共有バンドルプロバイダー向けのオプトインのライブカバレッジ:

```bash
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts
```

リポジトリラッパー:

```bash
pnpm test:live:media video
```

このライブファイルは、不足しているプロバイダー環境変数を `~/.profile` から読み込み、デフォルトでは
保存済み認証プロファイルよりもライブ/環境 API キーを優先し、
デフォルトでリリースに安全なスモークを実行します。

- スイープ内のすべての非 FAL プロバイダーに対する `generate`。
- 1 秒のロブスタープロンプト。
- `OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS` からのプロバイダーごとの操作上限
  (デフォルトは `180000`)。

FAL はオプトインです。プロバイダー側のキュー待ち時間がリリース時間を支配することがあるためです。

```bash
pnpm test:live:media video --video-providers fal
```

`OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1` を設定すると、共有スイープがローカルメディアで安全に実行できる
宣言済みの変換モードも実行します。

- `capabilities.imageToVideo.enabled` の場合の `imageToVideo`。
- `capabilities.videoToVideo.enabled` で、かつその
  プロバイダー/モデルが共有スイープ内のバッファ backed ローカル動画入力を受け付ける場合の `videoToVideo`。

現在、共有 `videoToVideo` ライブレーンは、`runway/gen4_aleph` を選択した場合にのみ
`runway` をカバーします。

## 設定

OpenClaw 設定でデフォルトの動画生成モデルを設定します。

```json5
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "qwen/wan2.6-t2v",
        fallbacks: ["qwen/wan2.6-r2v-flash"],
      },
    },
  },
}
```

または CLI 経由:

```bash
openclaw config set agents.defaults.videoGenerationModel.primary "qwen/wan2.6-t2v"
```

## 関連

- [Alibaba Model Studio](/ja-JP/providers/alibaba)
- [バックグラウンドタスク](/ja-JP/automation/tasks) - 非同期動画生成のタスク追跡
- [BytePlus](/ja-JP/concepts/model-providers#byteplus-international)
- [ComfyUI](/ja-JP/providers/comfy)
- [設定リファレンス](/ja-JP/gateway/config-agents#agent-defaults)
- [fal](/ja-JP/providers/fal)
- [Google (Gemini)](/ja-JP/providers/google)
- [MiniMax](/ja-JP/providers/minimax)
- [モデル](/ja-JP/concepts/models)
- [OpenAI](/ja-JP/providers/openai)
- [Qwen](/ja-JP/providers/qwen)
- [Runway](/ja-JP/providers/runway)
- [Together AI](/ja-JP/providers/together)
- [ツール概要](/ja-JP/tools)
- [Vydra](/ja-JP/providers/vydra)
- [xAI](/ja-JP/providers/xai)