Providers
xAI
OpenClaw มาพร้อมกับ Plugin ผู้ให้บริการ xai แบบบันเดิลสำหรับโมเดล Grok
เริ่มต้นใช้งาน
สร้าง API key
สร้าง API key ใน คอนโซล xAI
ตั้งค่า API key ของคุณ
ตั้งค่า XAI_API_KEY หรือเรียกใช้:
openclaw onboard --auth-choice xai-api-keyเลือกโมเดล
{ agents: { defaults: { model: { primary: "xai/grok-4.3" } } },}แค็ตตาล็อกในตัว
OpenClaw รวมตระกูลโมเดล xAI เหล่านี้มาให้พร้อมใช้งาน:
| ตระกูล | ID โมเดล |
|---|---|
| Grok 3 | grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast |
| Grok 4.3 | grok-4.3 |
| Grok 4 | grok-4, grok-4-0709 |
| Grok 4 Fast | grok-4-fast, grok-4-fast-non-reasoning |
| Grok 4.1 Fast | grok-4-1-fast, grok-4-1-fast-non-reasoning |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
| Grok Code | grok-code-fast-1 |
Plugin ยัง forward-resolve ID grok-4* และ grok-code-fast* ที่ใหม่กว่าเมื่อ
ID เหล่านั้นใช้รูปแบบ API เดียวกัน
การครอบคลุมฟีเจอร์ของ OpenClaw
Plugin แบบบันเดิลแมปพื้นผิว API สาธารณะปัจจุบันของ xAI ไปยังสัญญา ผู้ให้บริการและเครื่องมือที่ใช้ร่วมกันของ OpenClaw ความสามารถที่ไม่พอดีกับสัญญาที่ใช้ร่วมกัน (เช่น TTS แบบสตรีมมิงและเสียงแบบเรียลไทม์) จะไม่ถูกเปิดเผย - ดูตาราง ด้านล่าง
| ความสามารถของ xAI | พื้นผิว OpenClaw | สถานะ |
|---|---|---|
| แชท / Responses | ผู้ให้บริการโมเดล xai/<model> |
ใช่ |
| เว็บเสิร์ชฝั่งเซิร์ฟเวอร์ | ผู้ให้บริการ web_search grok |
ใช่ |
| การค้นหา X ฝั่งเซิร์ฟเวอร์ | เครื่องมือ x_search |
ใช่ |
| การประมวลผลโค้ดฝั่งเซิร์ฟเวอร์ | เครื่องมือ code_execution |
ใช่ |
| รูปภาพ | image_generate |
ใช่ |
| วิดีโอ | video_generate |
ใช่ |
| ข้อความเป็นเสียงแบบแบตช์ | messages.tts.provider: "xai" / tts |
ใช่ |
| TTS แบบสตรีมมิง | - | ไม่เปิดเผย; สัญญา TTS ของ OpenClaw ส่งคืนบัฟเฟอร์เสียงแบบสมบูรณ์ |
| เสียงพูดเป็นข้อความแบบแบตช์ | tools.media.audio / ความเข้าใจสื่อ |
ใช่ |
| เสียงพูดเป็นข้อความแบบสตรีมมิง | Voice Call streaming.provider: "xai" |
ใช่ |
| เสียงแบบเรียลไทม์ | - | ยังไม่เปิดเผย; สัญญาเซสชัน/WebSocket แตกต่างกัน |
| ไฟล์ / แบตช์ | ความเข้ากันได้กับ API โมเดลทั่วไปเท่านั้น | ไม่ใช่เครื่องมือ OpenClaw ระดับเฟิร์สต์คลาส |
การแมปโหมดเร็ว
/fast on หรือ agents.defaults.models["xai/<model>"].params.fastMode: true
เขียนคำขอ xAI แบบเนทีฟใหม่ดังนี้:
| โมเดลต้นทาง | เป้าหมายโหมดเร็ว |
|---|---|
grok-3 |
grok-3-fast |
grok-3-mini |
grok-3-mini-fast |
grok-4 |
grok-4-fast |
grok-4-0709 |
grok-4-fast |
นามแฝงความเข้ากันได้แบบดั้งเดิม
นามแฝงดั้งเดิมยังคงถูก normalize เป็น ID แบบบันเดิลมาตรฐาน:
| นามแฝงดั้งเดิม | ID มาตรฐาน |
|---|---|
grok-4-fast-reasoning |
grok-4-fast |
grok-4-1-fast-reasoning |
grok-4-1-fast |
grok-4.20-reasoning |
grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning |
grok-4.20-beta-latest-non-reasoning |
ฟีเจอร์
เว็บเสิร์ช
ผู้ให้บริการเว็บเสิร์ช grok แบบบันเดิลสามารถใช้ XAI_API_KEY หรือคีย์
เว็บเสิร์ชของ Plugin ได้:
openclaw config set tools.web.search.provider grokการสร้างวิดีโอ
Plugin xai แบบบันเดิลลงทะเบียนการสร้างวิดีโอผ่านเครื่องมือ
video_generate ที่ใช้ร่วมกัน
- โมเดลวิดีโอเริ่มต้น:
xai/grok-imagine-video - โหมด: ข้อความเป็นวิดีโอ, ภาพเป็นวิดีโอ, การสร้างภาพอ้างอิง, การแก้ไขวิดีโอระยะไกล และการขยายวิดีโอระยะไกล
- อัตราส่วนภาพ:
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - ความละเอียด:
480P,720P - ระยะเวลา: 1-15 วินาทีสำหรับการสร้าง/ภาพเป็นวิดีโอ, 1-10 วินาทีเมื่อใช้บทบาท
reference_image, 2-10 วินาทีสำหรับการขยาย - การสร้างภาพอ้างอิง: ตั้งค่า
imageRolesเป็นreference_imageสำหรับภาพที่ให้มาทุกภาพ; xAI ยอมรับภาพดังกล่าวได้สูงสุด 7 ภาพ
หากต้องการใช้ xAI เป็นผู้ให้บริการวิดีโอเริ่มต้น:
{ agents: { defaults: { videoGenerationModel: { primary: "xai/grok-imagine-video", }, }, },}การสร้างรูปภาพ
Plugin xai แบบบันเดิลลงทะเบียนการสร้างรูปภาพผ่านเครื่องมือ
image_generate ที่ใช้ร่วมกัน
- โมเดลรูปภาพเริ่มต้น:
xai/grok-imagine-image - โมเดลเพิ่มเติม:
xai/grok-imagine-image-pro - โหมด: ข้อความเป็นรูปภาพและการแก้ไขภาพอ้างอิง
- อินพุตอ้างอิง:
imageหนึ่งรายการหรือimagesได้สูงสุดห้ารายการ - อัตราส่วนภาพ:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - ความละเอียด:
1K,2K - จำนวน: ได้สูงสุด 4 ภาพ
OpenClaw ขอการตอบกลับรูปภาพแบบ b64_json จาก xAI เพื่อให้สื่อที่สร้างขึ้นสามารถ
จัดเก็บและส่งผ่านเส้นทางไฟล์แนบของช่องทางปกติได้ รูปภาพอ้างอิงในเครื่อง
จะถูกแปลงเป็น URL ข้อมูล; การอ้างอิง http(s) ระยะไกลจะถูกส่งผ่านตามเดิม
หากต้องการใช้ xAI เป็นผู้ให้บริการรูปภาพเริ่มต้น:
{ agents: { defaults: { imageGenerationModel: { primary: "xai/grok-imagine-image", }, }, },}ข้อความเป็นเสียง
Plugin xai แบบบันเดิลลงทะเบียนข้อความเป็นเสียงผ่านพื้นผิวผู้ให้บริการ tts
ที่ใช้ร่วมกัน
- เสียง:
eve,ara,rex,sal,leo,una - เสียงเริ่มต้น:
eve - รูปแบบ:
mp3,wav,pcm,mulaw,alaw - ภาษา: รหัส BCP-47 หรือ
auto - ความเร็ว: การแทนที่ความเร็วแบบเนทีฟของผู้ให้บริการ
- ไม่รองรับรูปแบบวอยซ์โน้ต Opus แบบเนทีฟ
หากต้องการใช้ xAI เป็นผู้ให้บริการ TTS เริ่มต้น:
{ messages: { tts: { provider: "xai", providers: { xai: { voiceId: "eve", }, }, }, },}เสียงพูดเป็นข้อความ
Plugin xai แบบบันเดิลลงทะเบียนเสียงพูดเป็นข้อความแบบแบตช์ผ่านพื้นผิว
การถอดเสียงเพื่อความเข้าใจสื่อของ OpenClaw
- โมเดลเริ่มต้น:
grok-stt - ปลายทาง: xAI REST
/v1/stt - เส้นทางอินพุต: อัปโหลดไฟล์เสียงแบบ multipart
- OpenClaw รองรับในทุกที่ที่การถอดเสียงขาเข้าใช้
tools.media.audioรวมถึงส่วนเสียงของช่องเสียง Discord และ ไฟล์แนบเสียงของช่องทาง
หากต้องการบังคับใช้ xAI สำหรับการถอดเสียงขาเข้า:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "xai", model: "grok-stt", }, ], }, }, },}สามารถระบุภาษาได้ผ่านการกำหนดค่าสื่อเสียงที่ใช้ร่วมกันหรือคำขอถอดเสียง รายการต่อรายการ คำใบ้พรอมป์ได้รับการยอมรับโดยพื้นผิว OpenClaw ที่ใช้ร่วมกัน แต่การผสานรวม xAI REST STT ส่งต่อเฉพาะไฟล์ โมเดล และ ภาษา เพราะสิ่งเหล่านั้นแมปกับปลายทางสาธารณะปัจจุบันของ xAI ได้อย่างชัดเจน
เสียงพูดเป็นข้อความแบบสตรีมมิง
Plugin xai แบบบันเดิลยังลงทะเบียนผู้ให้บริการการถอดเสียงแบบเรียลไทม์
สำหรับเสียงสายเสียงสดด้วย
- ปลายทาง: xAI WebSocket
wss://api.x.ai/v1/stt - การเข้ารหัสเริ่มต้น:
mulaw - อัตราสุ่มตัวอย่างเริ่มต้น:
8000 - endpointing เริ่มต้น:
800ms - ข้อความถอดเสียงชั่วคราว: เปิดใช้งานตามค่าเริ่มต้น
สตรีมสื่อ Twilio ของ Voice Call ส่งเฟรมเสียง G.711 µ-law ดังนั้น ผู้ให้บริการ xAI จึงส่งต่อเฟรมเหล่านั้นได้โดยตรงโดยไม่ต้องแปลงรหัส:
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "xai", providers: { xai: { apiKey: "${XAI_API_KEY}", endpointingMs: 800, language: "en", }, }, }, }, }, }, },}การกำหนดค่าที่ provider เป็นเจ้าของอยู่ภายใต้
plugins.entries.voice-call.config.streaming.providers.xai คีย์ที่รองรับ
ได้แก่ apiKey, baseUrl, sampleRate, encoding (pcm, mulaw หรือ
alaw), interimResults, endpointingMs และ language
การกำหนดค่า x_search
Plugin xAI ที่มาพร้อมชุดติดตั้งเปิดเผย x_search เป็นเครื่องมือ OpenClaw สำหรับค้นหา
เนื้อหา X (เดิมคือ Twitter) ผ่าน Grok
เส้นทางการกำหนดค่า: plugins.entries.xai.config.xSearch
| คีย์ | ประเภท | ค่าเริ่มต้น | คำอธิบาย |
|---|---|---|---|
enabled |
boolean | - | เปิดหรือปิดใช้งาน x_search |
model |
string | grok-4-1-fast |
โมเดลที่ใช้สำหรับคำขอ x_search |
baseUrl |
string | - | การแทนที่ URL ฐานของ xAI Responses |
inlineCitations |
boolean | - | รวมการอ้างอิงแบบอินไลน์ในผลลัพธ์ |
maxTurns |
number | - | จำนวนรอบการสนทนาสูงสุด |
timeoutSeconds |
number | - | ระยะหมดเวลาของคำขอเป็นวินาที |
cacheTtlMinutes |
number | - | อายุแคชเป็นนาที |
{ plugins: { entries: { xai: { config: { xSearch: { enabled: true, model: "grok-4-1-fast", baseUrl: "https://api.x.ai/v1", inlineCitations: true, }, }, }, }, },}การกำหนดค่า Code execution
Plugin xAI ที่มาพร้อมชุดติดตั้งเปิดเผย code_execution เป็นเครื่องมือ OpenClaw สำหรับ
การรันโค้ดระยะไกลในสภาพแวดล้อม sandbox ของ xAI
เส้นทางการกำหนดค่า: plugins.entries.xai.config.codeExecution
| คีย์ | ประเภท | ค่าเริ่มต้น | คำอธิบาย |
|---|---|---|---|
enabled |
boolean | true (หากมีคีย์) |
เปิดหรือปิดใช้งานการรันโค้ด |
model |
string | grok-4-1-fast |
โมเดลที่ใช้สำหรับคำขอรันโค้ด |
maxTurns |
number | - | จำนวนรอบการสนทนาสูงสุด |
timeoutSeconds |
number | - | ระยะหมดเวลาของคำขอเป็นวินาที |
{ plugins: { entries: { xai: { config: { codeExecution: { enabled: true, model: "grok-4-1-fast", }, }, }, }, },}ข้อจำกัดที่ทราบ
- การยืนยันตัวตนในปัจจุบันใช้คีย์ API เท่านั้น คีย์ API อาจถูกเก็บไว้ในโปรไฟล์การยืนยันตัวตน xAI ตัวแปรสภาพแวดล้อม หรือการกำหนดค่า Plugin ยังไม่มี OAuth ของ xAI หรือ โฟลว์ device-code ใน OpenClaw
grok-4.20-multi-agent-experimental-beta-0304ไม่รองรับบนเส้นทาง provider xAI ปกติ เพราะต้องใช้พื้นผิว API ต้นทางที่แตกต่างจาก การขนส่ง xAI มาตรฐานของ OpenClaw- เสียง xAI Realtime ยังไม่ได้ลงทะเบียนเป็น provider ของ OpenClaw ต้องใช้สัญญาเซสชันเสียงแบบสองทิศทางที่แตกต่างจาก STT แบบแบตช์หรือ การถอดเสียงแบบสตรีมมิง
qualityของภาพ xAI,maskของภาพ และอัตราส่วนภาพเพิ่มเติมที่ใช้ได้เฉพาะแบบ native ยังไม่ถูกเปิดเผยจนกว่าเครื่องมือimage_generateที่ใช้ร่วมกันจะมี ตัวควบคุมข้าม provider ที่สอดคล้องกัน
หมายเหตุขั้นสูง
- OpenClaw ใช้การแก้ไขความเข้ากันได้สำหรับ schema ของเครื่องมือและการเรียกเครื่องมือที่เฉพาะกับ xAI โดยอัตโนมัติบนเส้นทาง runner ที่ใช้ร่วมกัน
- คำขอ xAI แบบ native ตั้งค่าเริ่มต้นเป็น
tool_stream: trueตั้งค่าagents.defaults.models["xai/<model>"].params.tool_streamเป็นfalseเพื่อ ปิดใช้งาน - wrapper xAI ที่มาพร้อมชุดติดตั้งจะลบแฟล็ก schema ของเครื่องมือแบบ strict ที่ไม่รองรับและ คีย์ payload การให้เหตุผลก่อนส่งคำขอ xAI แบบ native
web_search,x_searchและcode_executionถูกเปิดเผยเป็นเครื่องมือ OpenClaw OpenClaw เปิดใช้งาน built-in ของ xAI ที่ต้องใช้ภายในคำขอเครื่องมือแต่ละรายการ แทนการแนบเครื่องมือ native ทั้งหมดกับทุกเทิร์นของแชต- Grok
web_searchอ่านplugins.entries.xai.config.webSearch.baseUrlx_searchอ่านplugins.entries.xai.config.xSearch.baseUrlจากนั้น fallback ไปยัง URL ฐานของการค้นหาเว็บ Grok x_searchและcode_executionเป็นของ Plugin xAI ที่มาพร้อมชุดติดตั้ง ไม่ได้ถูก hardcode ไว้ใน runtime โมเดลหลักcode_executionคือการรันใน sandbox ของ xAI ระยะไกล ไม่ใช่execในเครื่อง
การทดสอบแบบ live
เส้นทางสื่อ xAI ครอบคลุมด้วย unit test และชุดทดสอบแบบ live ที่เลือกเปิดใช้ คำสั่ง live
จะโหลด secrets จาก shell ล็อกอินของคุณ รวมถึง ~/.profile ก่อน
probe XAI_API_KEY
pnpm test extensions/xaiOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.tsOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.tsไฟล์ live เฉพาะ provider จะสังเคราะห์ TTS ปกติ, PCM TTS ที่เหมาะกับระบบโทรศัพท์, ถอดเสียงผ่าน STT แบบแบตช์ของ xAI, สตรีม PCM เดียวกันผ่าน STT เรียลไทม์ของ xAI, สร้างผลลัพธ์ text-to-image และแก้ไขภาพอ้างอิง ไฟล์ live ของภาพที่ใช้ร่วมกัน ยืนยัน provider xAI เดียวกันผ่านเส้นทางการเลือก runtime, fallback, การทำให้เป็นมาตรฐาน, และแนบสื่อของ OpenClaw