--- read_when: - Sie möchten Hugging Face Inference mit OpenClaw verwenden - Sie benötigen die HF-Token-Umgebungsvariable oder die CLI-Auth-Auswahl summary: Einrichtung von Hugging Face Inference (Authentifizierung + Modellauswahl) title: Hugging Face (Inferenz) x-i18n: generated_at: "2026-04-24T06:54:15Z" model: gpt-5.4 provider: openai source_hash: 93b3049e8d42787acba12ec3ddf70603159251dae1d870047f8ffc9242f202a5 source_path: providers/huggingface.md workflow: 15 --- [Hugging Face Inference Providers](https://huggingface.co/docs/inference-providers) bieten OpenAI-kompatible Chat Completions über eine einzige Router-API. Sie erhalten mit einem Token Zugriff auf viele Modelle (DeepSeek, Llama und mehr). OpenClaw verwendet den **OpenAI-kompatiblen Endpunkt** (nur Chat Completions); für Text-zu-Bild, Embeddings oder Sprache verwenden Sie die [HF-Inferenz-Clients](https://huggingface.co/docs/api-inference/quicktour) direkt. - Provider: `huggingface` - Auth: `HUGGINGFACE_HUB_TOKEN` oder `HF_TOKEN` (feingranulares Token mit **Make calls to Inference Providers**) - API: OpenAI-kompatibel (`https://router.huggingface.co/v1`) - Abrechnung: Ein einzelnes HF-Token; [Preise](https://huggingface.co/docs/inference-providers/pricing) folgen den Provider-Tarifen mit einer kostenlosen Stufe. ## Erste Schritte Gehen Sie zu [Hugging Face Settings Tokens](https://huggingface.co/settings/tokens/new?ownUserPermissions=inference.serverless.write&tokenType=fineGrained) und erstellen Sie ein neues feingranulares Token. Das Token muss die Berechtigung **Make calls to Inference Providers** aktiviert haben, sonst werden API-Anfragen abgewiesen. Wählen Sie **Hugging Face** im Provider-Dropdown aus und geben Sie dann Ihren API-Schlüssel ein, wenn Sie dazu aufgefordert werden: ```bash openclaw onboard --auth-choice huggingface-api-key ``` Wählen Sie im Dropdown **Default Hugging Face model** das gewünschte Modell aus. Die Liste wird aus der Inference API geladen, wenn Sie ein gültiges Token haben; andernfalls wird eine integrierte Liste angezeigt. Ihre Auswahl wird als Standardmodell gespeichert. Sie können das Standardmodell später auch in der Konfiguration setzen oder ändern: ```json5 { agents: { defaults: { model: { primary: "huggingface/deepseek-ai/DeepSeek-R1" }, }, }, } ``` ```bash openclaw models list --provider huggingface ``` ### Nicht-interaktives Setup ```bash openclaw onboard --non-interactive \ --mode local \ --auth-choice huggingface-api-key \ --huggingface-api-key "$HF_TOKEN" ``` Dadurch wird `huggingface/deepseek-ai/DeepSeek-R1` als Standardmodell gesetzt. ## Modell-IDs Modellreferenzen verwenden die Form `huggingface//` (Hub-Stil-IDs). Die folgende Liste stammt von **GET** `https://router.huggingface.co/v1/models`; Ihr Katalog kann mehr enthalten. | Modell | Ref (mit Präfix `huggingface/`) | | --------------------- | ----------------------------------- | | DeepSeek R1 | `deepseek-ai/DeepSeek-R1` | | DeepSeek V3.2 | `deepseek-ai/DeepSeek-V3.2` | | Qwen3 8B | `Qwen/Qwen3-8B` | | Qwen2.5 7B Instruct | `Qwen/Qwen2.5-7B-Instruct` | | Qwen3 32B | `Qwen/Qwen3-32B` | | Llama 3.3 70B Instruct | `meta-llama/Llama-3.3-70B-Instruct` | | Llama 3.1 8B Instruct | `meta-llama/Llama-3.1-8B-Instruct` | | GPT-OSS 120B | `openai/gpt-oss-120b` | | GLM 4.7 | `zai-org/GLM-4.7` | | Kimi K2.5 | `moonshotai/Kimi-K2.5` | Sie können an jede Modell-ID `:fastest` oder `:cheapest` anhängen. Legen Sie Ihre Standardreihenfolge in den [Inference Provider settings](https://hf.co/settings/inference-providers) fest; siehe [Inference Providers](https://huggingface.co/docs/inference-providers) und **GET** `https://router.huggingface.co/v1/models` für die vollständige Liste. ## Erweiterte Konfiguration OpenClaw erkennt Modelle, indem der **Inference-Endpunkt direkt** aufgerufen wird: ```bash GET https://router.huggingface.co/v1/models ``` (Optional: senden Sie `Authorization: Bearer $HUGGINGFACE_HUB_TOKEN` oder `$HF_TOKEN` für die vollständige Liste; einige Endpunkte geben ohne Auth nur eine Teilmenge zurück.) Die Antwort entspricht dem OpenAI-Stil: `{ "object": "list", "data": [ { "id": "Qwen/Qwen3-8B", "owned_by": "Qwen", ... }, ... ] }`. Wenn Sie einen Hugging-Face-API-Schlüssel konfigurieren (über Onboarding, `HUGGINGFACE_HUB_TOKEN` oder `HF_TOKEN`), verwendet OpenClaw dieses GET, um verfügbare Chat-Completion-Modelle zu erkennen. Während des **interaktiven Setups** sehen Sie nach Eingabe Ihres Tokens ein Dropdown **Default Hugging Face model**, das aus dieser Liste befüllt wird (oder aus dem integrierten Katalog, wenn die Anfrage fehlschlägt). Zur Laufzeit (z. B. beim Gateway-Start) ruft OpenClaw, wenn ein Schlüssel vorhanden ist, erneut **GET** `https://router.huggingface.co/v1/models` auf, um den Katalog zu aktualisieren. Die Liste wird mit einem integrierten Katalog zusammengeführt (für Metadaten wie Kontextfenster und Kosten). Wenn die Anfrage fehlschlägt oder kein Schlüssel gesetzt ist, wird nur der integrierte Katalog verwendet. - **Name aus der API:** Der Anzeigename des Modells wird **aus GET /v1/models abgeleitet**, wenn die API `name`, `title` oder `display_name` zurückgibt; andernfalls wird er aus der Modell-ID abgeleitet (z. B. wird `deepseek-ai/DeepSeek-R1` zu „DeepSeek R1“). - **Anzeigenamen überschreiben:** Sie können pro Modell ein benutzerdefiniertes Label in der Konfiguration setzen, sodass es in CLI und UI so erscheint, wie Sie es möchten: ```json5 { agents: { defaults: { models: { "huggingface/deepseek-ai/DeepSeek-R1": { alias: "DeepSeek R1 (schnell)" }, "huggingface/deepseek-ai/DeepSeek-R1:cheapest": { alias: "DeepSeek R1 (günstig)" }, }, }, }, } ``` - **Richtlinien-Suffixe:** Die gebündelten Hugging-Face-Dokumente und -Helfer in OpenClaw behandeln derzeit diese beiden Suffixe als integrierte Richtlinienvarianten: - **`:fastest`** — höchster Durchsatz. - **`:cheapest`** — niedrigste Kosten pro Ausgabetoken. Sie können diese als separate Einträge in `models.providers.huggingface.models` hinzufügen oder `model.primary` mit dem Suffix setzen. Sie können Ihre Standardreihenfolge für Provider auch in den [Inference Provider settings](https://hf.co/settings/inference-providers) festlegen (ohne Suffix = diese Reihenfolge verwenden). - **Zusammenführung der Konfiguration:** Bestehende Einträge in `models.providers.huggingface.models` (z. B. in `models.json`) bleiben beim Zusammenführen der Konfiguration erhalten. Daher bleiben benutzerdefinierte Werte für `name`, `alias` oder Modelloptionen, die Sie dort setzen, erhalten. Wenn das Gateway als Daemon läuft (launchd/systemd), stellen Sie sicher, dass `HUGGINGFACE_HUB_TOKEN` oder `HF_TOKEN` für diesen Prozess verfügbar ist (zum Beispiel in `~/.openclaw/.env` oder über `env.shellEnv`). OpenClaw akzeptiert sowohl `HUGGINGFACE_HUB_TOKEN` als auch `HF_TOKEN` als Aliasse für Umgebungsvariablen. Beide funktionieren; wenn beide gesetzt sind, hat `HUGGINGFACE_HUB_TOKEN` Vorrang. ```json5 { agents: { defaults: { model: { primary: "huggingface/deepseek-ai/DeepSeek-R1", fallbacks: ["huggingface/Qwen/Qwen3-8B"], }, models: { "huggingface/deepseek-ai/DeepSeek-R1": { alias: "DeepSeek R1" }, "huggingface/Qwen/Qwen3-8B": { alias: "Qwen3 8B" }, }, }, }, } ``` ```json5 { agents: { defaults: { model: { primary: "huggingface/Qwen/Qwen3-8B" }, models: { "huggingface/Qwen/Qwen3-8B": { alias: "Qwen3 8B" }, "huggingface/Qwen/Qwen3-8B:cheapest": { alias: "Qwen3 8B (am günstigsten)" }, "huggingface/Qwen/Qwen3-8B:fastest": { alias: "Qwen3 8B (am schnellsten)" }, }, }, }, } ``` ```json5 { agents: { defaults: { model: { primary: "huggingface/deepseek-ai/DeepSeek-V3.2", fallbacks: [ "huggingface/meta-llama/Llama-3.3-70B-Instruct", "huggingface/openai/gpt-oss-120b", ], }, models: { "huggingface/deepseek-ai/DeepSeek-V3.2": { alias: "DeepSeek V3.2" }, "huggingface/meta-llama/Llama-3.3-70B-Instruct": { alias: "Llama 3.3 70B" }, "huggingface/openai/gpt-oss-120b": { alias: "GPT-OSS 120B" }, }, }, }, } ``` ```json5 { agents: { defaults: { model: { primary: "huggingface/Qwen/Qwen2.5-7B-Instruct:cheapest" }, models: { "huggingface/Qwen/Qwen2.5-7B-Instruct": { alias: "Qwen2.5 7B" }, "huggingface/Qwen/Qwen2.5-7B-Instruct:cheapest": { alias: "Qwen2.5 7B (günstig)" }, "huggingface/deepseek-ai/DeepSeek-R1:fastest": { alias: "DeepSeek R1 (schnell)" }, "huggingface/meta-llama/Llama-3.1-8B-Instruct": { alias: "Llama 3.1 8B" }, }, }, }, } ``` ## Verwandt Überblick über alle Provider, Modellreferenzen und Failover-Verhalten. Wie Modelle ausgewählt und konfiguriert werden. Offizielle Dokumentation zu Hugging Face Inference Providers. Vollständige Konfigurationsreferenz.