Testing
Test Etme
OpenClaw'ın üç Vitest paketi (birim/entegrasyon, e2e, canlı) ve küçük bir Docker çalıştırıcı kümesi vardır. Bu belge bir "nasıl test ediyoruz" kılavuzudur:
- Her paketin neleri kapsadığı (ve kasıtlı olarak neleri kapsamadığı).
- Yaygın iş akışları için hangi komutların çalıştırılacağı (yerel, gönderim öncesi, hata ayıklama).
- Canlı testlerin kimlik bilgilerini nasıl keşfettiği ve modelleri/sağlayıcıları nasıl seçtiği.
- Gerçek dünyadaki model/sağlayıcı sorunları için regresyonların nasıl ekleneceği.
Hızlı başlangıç
Çoğu gün:
- Tam kapı (gönderimden önce beklenir):
pnpm build && pnpm check && pnpm check:test-types && pnpm test - Geniş kaynaklı bir makinede daha hızlı yerel tam paket çalıştırması:
pnpm test:max - Doğrudan Vitest izleme döngüsü:
pnpm test:watch - Doğrudan dosya hedefleme artık eklenti/kanal yollarını da yönlendirir:
pnpm test extensions/discord/src/monitor/message-handler.preflight.test.ts - Tek bir hata üzerinde yineleme yaparken önce hedefli çalıştırmaları tercih edin.
- Docker destekli QA sitesi:
pnpm qa:lab:up - Linux VM destekli QA kulvarı:
pnpm openclaw qa suite --runner multipass --scenario channel-chat-baseline
Testlere dokunduğunuzda veya ekstra güven istediğinizde:
- Kapsama kapısı:
pnpm test:coverage - E2E paketi:
pnpm test:e2e
Gerçek sağlayıcılarda/modellerde hata ayıklarken (gerçek kimlik bilgileri gerekir):
- Canlı paket (modeller + Gateway araç/görüntü probları):
pnpm test:live - Tek bir canlı dosyayı sessizce hedefleyin:
pnpm test:live -- src/agents/models.profiles.live.test.ts - Çalışma zamanı performans raporları: gerçek bir
openai/gpt-5.4ajan dönüşü içinlive_gpt54=trueile veya Kova CPU/heap/trace yapıtları içindeep_profile=trueileOpenClaw Performancegönderin. Günlük zamanlanmış çalıştırmalar,CLAWGRIT_REPORTS_TOKENyapılandırıldığında sahte sağlayıcı, derin profil ve GPT 5.4 kulvarı yapıtlarınıopenclaw/clawgrit-reportsüzerinde yayımlar. Sahte sağlayıcı raporu ayrıca kaynak düzeyinde Gateway başlatma, bellek, Plugin baskısı, yinelenen sahte model merhaba döngüsü ve CLI başlangıç sayılarını içerir. - Docker canlı model taraması:
pnpm test:docker:live-models- Seçilen her model artık bir metin dönüşü artı küçük bir dosya okuma tarzı prob çalıştırır.
Meta verisi
imagegirdisini duyuran modeller ayrıca küçük bir görüntü dönüşü çalıştırır. Sağlayıcı hatalarını izole ederken ek problarıOPENCLAW_LIVE_MODEL_FILE_PROBE=0veyaOPENCLAW_LIVE_MODEL_IMAGE_PROBE=0ile devre dışı bırakın. - CI kapsamı: günlük
OpenClaw Scheduled Live And E2E Checksve manuelOpenClaw Release Checks, her ikisi de yeniden kullanılabilir canlı/E2E iş akışınıinclude_live_suites: trueile çağırır; bu, sağlayıcıya göre parçalara ayrılmış ayrı Docker canlı model matris işlerini içerir. - Odaklı CI yeniden çalıştırmaları için
OpenClaw Live And E2E Checks (Reusable)iş akışınıinclude_live_suites: truevelive_models_only: trueile gönderin. - Yeni yüksek sinyalli sağlayıcı sırlarını
scripts/ci-hydrate-live-auth.shdosyasına, ayrıca.github/workflows/openclaw-live-and-e2e-checks-reusable.ymldosyasına ve onun zamanlanmış/sürüm çağırıcılarına ekleyin.
- Seçilen her model artık bir metin dönüşü artı küçük bir dosya okuma tarzı prob çalıştırır.
Meta verisi
- Yerel Codex bağlı sohbet smoke testi:
pnpm test:docker:live-codex-bind- Codex uygulama sunucusu yolu üzerinde bir Docker canlı kulvarı çalıştırır,
/codex bindile sentetik bir Slack DM bağlar,/codex fastve/codex permissionskomutlarını çalıştırır, ardından düz bir yanıtın ve bir görüntü ekinin ACP yerine yerel Plugin bağı üzerinden yönlendiğini doğrular.
- Codex uygulama sunucusu yolu üzerinde bir Docker canlı kulvarı çalıştırır,
- Codex uygulama sunucusu harness smoke testi:
pnpm test:docker:live-codex-harness- Gateway ajan dönüşlerini Plugin'in sahip olduğu Codex uygulama sunucusu harness'ı üzerinden çalıştırır,
/codex statusve/codex modelsdoğrular ve varsayılan olarak görüntü, cron MCP, alt ajan ve Guardian problarını çalıştırır. Diğer Codex uygulama sunucusu hatalarını izole ederken alt ajan probunuOPENCLAW_LIVE_CODEX_HARNESS_SUBAGENT_PROBE=0ile devre dışı bırakın. Odaklı bir alt ajan kontrolü için diğer probları devre dışı bırakın:OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0 OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0 OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0 OPENCLAW_LIVE_CODEX_HARNESS_SUBAGENT_PROBE=1 pnpm test:docker:live-codex-harness.OPENCLAW_LIVE_CODEX_HARNESS_SUBAGENT_ONLY=0ayarlanmadığı sürece bu, alt ajan probundan sonra çıkar.
- Gateway ajan dönüşlerini Plugin'in sahip olduğu Codex uygulama sunucusu harness'ı üzerinden çalıştırır,
- Codex isteğe bağlı kurulum smoke testi:
pnpm test:docker:codex-on-demand- Paketlenmiş OpenClaw tarball'ını Docker içinde kurar, OpenAI API anahtarı
ilk kurulumunu çalıştırır ve Codex Plugin'i ile
@openai/codexbağımlılığının istek üzerine yönetilen npm köküne indirildiğini doğrular.
- Paketlenmiş OpenClaw tarball'ını Docker içinde kurar, OpenAI API anahtarı
ilk kurulumunu çalıştırır ve Codex Plugin'i ile
- Canlı Plugin araç bağımlılığı smoke testi:
pnpm test:docker:live-plugin-tool- Gerçek bir
slugifybağımlılığına sahip bir fixture Plugin'i paketler, onunpm-pack:üzerinden kurar, yönetilen npm kökü altındaki bağımlılığı doğrular, ardından canlı bir OpenAI modelinden Plugin aracını çağırmasını ve gizli slug'ı döndürmesini ister.
- Gerçek bir
- Crestodian kurtarma komutu smoke testi:
pnpm test:live:crestodian-rescue-channel- Mesaj kanalı kurtarma komut yüzeyi için isteğe bağlı, ek güvence kontrolü.
/crestodian statusçalıştırır, kalıcı bir model değişikliğini kuyruğa alır,/crestodian yesyanıtlar ve denetim/yapılandırma yazma yolunu doğrular.
- Mesaj kanalı kurtarma komut yüzeyi için isteğe bağlı, ek güvence kontrolü.
- Crestodian planlayıcı Docker smoke testi:
pnpm test:docker:crestodian-planner- Crestodian'ı yapılandırmasız bir kapsayıcıda,
PATHüzerinde sahte bir Claude CLI ile çalıştırır ve bulanık planlayıcı geri dönüşünün denetimli, tipli bir yapılandırma yazmasına çevrildiğini doğrular.
- Crestodian'ı yapılandırmasız bir kapsayıcıda,
- Crestodian ilk çalıştırma Docker smoke testi:
pnpm test:docker:crestodian-first-run- Boş bir OpenClaw durum dizininden başlar, yalın
openclawkomutunu Crestodian'a yönlendirir, kurulum/model/ajan/Discord Plugin + SecretRef yazmalarını uygular, yapılandırmayı doğrular ve denetim girdilerini doğrular. Aynı Ring 0 kurulum yolu QA Lab'de depnpm openclaw qa suite --scenario crestodian-ring-zero-setupile kapsanır.
- Boş bir OpenClaw durum dizininden başlar, yalın
- Moonshot/Kimi maliyet smoke testi:
MOONSHOT_API_KEYayarlıykenopenclaw models list --provider moonshot --jsonçalıştırın, ardından izole edilmiş biropenclaw agent --local --session-id live-kimi-cost --message 'Reply exactly: KIMI_LIVE_OK' --thinking off --jsonkomutunumoonshot/kimi-k2.6üzerinde çalıştırın. JSON'un Moonshot/K2.6 raporladığını ve asistan transkriptinin normalize edilmişusage.costsakladığını doğrulayın.
QA'ya özel çalıştırıcılar
QA-lab gerçekçiliğine ihtiyaç duyduğunuzda bu komutlar ana test paketlerinin yanında yer alır:
CI, QA Lab'i ayrılmış iş akışlarında çalıştırır. Ajanik eşdeğerlik bağımsız bir PR iş akışı değil,
QA-Lab - All Lanes ve sürüm doğrulaması altında iç içedir.
Geniş doğrulama, rerun_group=qa-parity ile Full Release Validation veya release-checks QA grubunu kullanmalıdır.
Kararlı/varsayılan sürüm kontrolleri kapsamlı canlı/Docker soak'ı run_release_soak=true arkasında tutar;
full profili soak'ı zorunlu kılar. QA-Lab - All Lanes,
main üzerinde gecelik olarak ve manuel gönderimden; sahte eşdeğerlik kulvarı, canlı
Matrix kulvarı, Convex tarafından yönetilen canlı Telegram kulvarı ve Convex tarafından yönetilen canlı Discord
kulvarı paralel işler olarak çalışır. Zamanlanmış QA ve sürüm kontrolleri Matrix'e
--profile fast değerini açıkça geçirirken, Matrix CLI ve manuel iş akışı girdisi
varsayılanı all olarak kalır; manuel gönderim all değerini transport,
media, e2ee-smoke, e2ee-deep ve e2ee-cli işlerine bölebilir. OpenClaw Release Checks, sürüm onayından önce eşdeğerliği ve hızlı Matrix ile Telegram kulvarlarını çalıştırır;
sürüm aktarım kontrolleri deterministik kalsın ve normal sağlayıcı Plugin başlangıcından kaçınsın diye
mock-openai/gpt-5.5 kullanır. Bu canlı aktarım
Gateway'leri bellek aramasını devre dışı bırakır; bellek davranışı QA eşdeğerlik
paketleri tarafından kapsanmaya devam eder.
Tam sürüm canlı medya parçaları,
zaten ffmpeg ve ffprobe içeren
ghcr.io/openclaw/openclaw-live-media-runner:ubuntu-24.04 kullanır. Docker canlı model/arka uç parçaları,
seçilen her commit için bir kez oluşturulan paylaşılan
ghcr.io/openclaw/openclaw-live-test:<sha> görüntüsünü kullanır, ardından her parça içinde yeniden derlemek yerine
OPENCLAW_SKIP_DOCKER_BUILD=1 ile onu çeker.
pnpm openclaw qa suite- Depo destekli QA senaryolarını doğrudan ana makinede çalıştırır.
- Varsayılan olarak birden çok seçili senaryoyu yalıtılmış Gateway
işçileriyle paralel çalıştırır.
qa-channelvarsayılan olarak eşzamanlılığı 4 yapar (seçili senaryo sayısıyla sınırlıdır). İşçi sayısını ayarlamak için--concurrency <count>kullanın veya eski seri hat için--concurrency 1kullanın. - Herhangi bir senaryo başarısız olduğunda sıfır olmayan kodla çıkar. Hata
veren bir çıkış kodu olmadan artifact istediğinizde
--allow-failureskullanın. live-frontier,mock-openaiveaimocksağlayıcı modlarını destekler.aimock, senaryodan haberdarmock-openaihattını değiştirmeden deneysel fixture ve protokol mock kapsamı için yerel AIMock destekli bir sağlayıcı sunucusu başlatır.
pnpm test:plugins:kitchen-sink-live- Canlı OpenAI Kitchen Sink Plugin sınama dizisini QA Lab üzerinden çalıştırır.
Harici Kitchen Sink paketini kurar, Plugin SDK yüzeyi envanterini doğrular,
/healthzve/readyzuçlarını yoklar, Gateway CPU/RSS kanıtını kaydeder, canlı bir OpenAI turu çalıştırır ve adversarial tanılamaları denetler.OPENAI_API_KEYgibi canlı OpenAI kimlik doğrulaması gerektirir. Hydrate edilmiş Testbox oturumlarında,openclaw-testbox-envyardımcısı mevcut olduğunda Testbox canlı kimlik doğrulama profilini otomatik olarak kaynak alır.
- Canlı OpenAI Kitchen Sink Plugin sınama dizisini QA Lab üzerinden çalıştırır.
Harici Kitchen Sink paketini kurar, Plugin SDK yüzeyi envanterini doğrular,
pnpm test:gateway:cpu-scenarios- Gateway başlangıç karşılaştırmasını ve küçük bir mock QA Lab senaryo paketini
(
channel-chat-baseline,memory-failure-fallback,gateway-restart-inflight-run) çalıştırır ve birleşik CPU gözlem özetini.artifacts/gateway-cpu-scenarios/altında yazar. - Varsayılan olarak yalnızca sürekli sıcak CPU gözlemlerini bayraklar
(
--cpu-core-warnile--hot-wall-warn-ms), böylece kısa başlangıç patlamaları dakikalar süren Gateway peg regresyonu gibi görünmeden metrik olarak kaydedilir. - Oluşturulmuş
distartifact'lerini kullanır; checkout'ta zaten taze çalışma zamanı çıktısı yoksa önce build çalıştırın.
- Gateway başlangıç karşılaştırmasını ve küçük bir mock QA Lab senaryo paketini
(
pnpm openclaw qa suite --runner multipass- Aynı QA paketini tek kullanımlık bir Multipass Linux VM içinde çalıştırır.
- Ana makinedeki
qa suiteile aynı senaryo seçimi davranışını korur. qa suiteile aynı sağlayıcı/model seçim bayraklarını yeniden kullanır.- Canlı çalıştırmalar, konuk için pratik olan desteklenen QA kimlik doğrulama
girdilerini iletir: env tabanlı sağlayıcı anahtarları, QA canlı sağlayıcı
yapılandırma yolu ve mevcut olduğunda
CODEX_HOME. - Çıkış dizinleri repo kökü altında kalmalıdır, böylece konuk bağlı çalışma alanı üzerinden geri yazabilir.
- Normal QA raporu ve özetine ek olarak Multipass günlüklerini
.artifacts/qa-e2e/...altında yazar.
pnpm qa:lab:up- Operatör tarzı QA çalışması için Docker destekli QA sitesini başlatır.
pnpm test:docker:npm-onboard-channel-agent- Geçerli checkout'tan bir npm tarball oluşturur, bunu Docker içinde global olarak kurar, etkileşimsiz OpenAI API anahtarı onboarding'i çalıştırır, varsayılan olarak Telegram'ı yapılandırır, paketlenmiş Plugin çalışma zamanının başlangıç bağımlılık onarımı olmadan yüklendiğini doğrular, doctor çalıştırır ve mock edilmiş bir OpenAI uç noktasına karşı bir yerel ajan turu çalıştırır.
- Aynı paketlenmiş kurulum hattını Discord ile çalıştırmak için
OPENCLAW_NPM_ONBOARD_CHANNEL=discordkullanın.
pnpm test:docker:session-runtime-context- Gömülü çalışma zamanı bağlamı transcript'leri için deterministik bir
oluşturulmuş uygulama Docker smoke testi çalıştırır. Gizli OpenClaw çalışma
zamanı bağlamının görünür kullanıcı turuna sızmak yerine görüntülenmeyen
özel bir mesaj olarak kalıcılaştırıldığını doğrular, ardından etkilenmiş
bozuk bir oturum JSONL dosyası seed eder ve
openclaw doctor --fixkomutunun bunu yedekle birlikte aktif dala yeniden yazdığını doğrular.
- Gömülü çalışma zamanı bağlamı transcript'leri için deterministik bir
oluşturulmuş uygulama Docker smoke testi çalıştırır. Gizli OpenClaw çalışma
zamanı bağlamının görünür kullanıcı turuna sızmak yerine görüntülenmeyen
özel bir mesaj olarak kalıcılaştırıldığını doğrular, ardından etkilenmiş
bozuk bir oturum JSONL dosyası seed eder ve
pnpm test:docker:npm-telegram-live- Docker içinde bir OpenClaw paket adayını kurar, kurulu paket onboarding'ini çalıştırır, kurulu CLI üzerinden Telegram'ı yapılandırır, ardından bu kurulu paketi SUT Gateway olarak kullanarak canlı Telegram QA hattını yeniden kullanır.
- Sarmalayıcı, checkout'tan yalnızca
qa-labharness kaynağını bağlar; kurulu paketdist,openclaw/plugin-sdkve paketlenmiş Plugin çalışma zamanına sahip olur, böylece hat geçerli checkout Plugin'lerini test altındaki paketle karıştırmaz. - Varsayılan
OPENCLAW_NPM_TELEGRAM_PACKAGE_SPEC=openclaw@betadeğeridir; registry'den kurmak yerine çözümlenmiş yerel bir tarball test etmek içinOPENCLAW_NPM_TELEGRAM_PACKAGE_TGZ=/path/to/openclaw-current.tgzveyaOPENCLAW_CURRENT_PACKAGE_TGZayarlayın. pnpm openclaw qa telegramile aynı Telegram env kimlik bilgilerini veya Convex kimlik bilgisi kaynağını kullanır. CI/release otomasyonu içinOPENCLAW_NPM_TELEGRAM_CREDENTIAL_SOURCE=convexile birlikteOPENCLAW_QA_CONVEX_SITE_URLve rol sırrını ayarlayın. CI içindeOPENCLAW_QA_CONVEX_SITE_URLve bir Convex rol sırrı mevcutsa Docker sarmalayıcı Convex'i otomatik olarak seçer.- Sarmalayıcı, Docker build/kurulum çalışmasından önce ana makinede Telegram
veya Convex kimlik bilgisi env değerlerini doğrular. Yalnızca kimlik bilgisi
öncesi kurulumu bilinçli olarak hata ayıklarken
OPENCLAW_NPM_TELEGRAM_SKIP_CREDENTIAL_PREFLIGHT=1ayarlayın. OPENCLAW_NPM_TELEGRAM_CREDENTIAL_ROLE=ci|maintainer, paylaşılanOPENCLAW_QA_CREDENTIAL_ROLEdeğerini yalnızca bu hat için geçersiz kılar.- GitHub Actions bu hattı manuel maintainer workflow'u
NPM Telegram Beta E2Eolarak sunar. Merge sırasında çalışmaz. Workflow,qa-live-sharedortamını ve Convex CI kimlik bilgisi lease'lerini kullanır.
- GitHub Actions ayrıca bir aday pakete karşı yan çalıştırma ürün kanıtı için
Package Acceptancesunar. Güvenilir bir ref, yayımlanmış npm spec, SHA-256 ile HTTPS tarball URL'si veya başka bir çalıştırmadan tarball artifact'i kabul eder, normalize edilmişopenclaw-current.tgzdosyasınıpackage-under-testolarak yükler, ardından mevcut Docker E2E scheduler'ını smoke, package, product, full veya özel hat profilleriyle çalıştırır. Telegram QA workflow'unu aynıpackage-under-testartifact'ine karşı çalıştırmak içintelegram_mode=mock-openaiveyalive-frontierayarlayın.- En son beta ürün kanıtı:
gh workflow run package-acceptance.yml --ref main \ -f source=npm \ -f package_spec=openclaw@beta \ -f suite_profile=product \ -f telegram_mode=mock-openai- Kesin tarball URL kanıtı bir digest gerektirir:
gh workflow run package-acceptance.yml --ref main \ -f source=url \ -f package_url=https://registry.npmjs.org/openclaw/-/openclaw-VERSION.tgz \ -f package_sha256=<sha256> \ -f suite_profile=package- Artifact kanıtı, başka bir Actions çalıştırmasından tarball artifact'i indirir:
gh workflow run package-acceptance.yml --ref main \ -f source=artifact \ -f artifact_run_id=<run-id> \ -f artifact_name=<artifact-name> \ -f suite_profile=smoke-
pnpm test:docker:plugins- Geçerli OpenClaw build'ini Docker içinde paketleyip kurar, OpenAI yapılandırılmış olarak Gateway'i başlatır, ardından yapılandırma düzenlemeleriyle paketlenmiş kanal/Plugin'leri etkinleştirir.
- Kurulum keşfinin yapılandırılmamış indirilebilir Plugin'leri bulunmaz bıraktığını, ilk yapılandırılmış doctor onarımının eksik indirilebilir her Plugin'i açıkça kurduğunu ve ikinci bir yeniden başlatmanın gizli bağımlılık onarımı çalıştırmadığını doğrular.
- Ayrıca bilinen daha eski bir npm baseline kurar,
openclaw update --tag <candidate>çalıştırmadan önce Telegram'ı etkinleştirir ve adayın güncelleme sonrası doctor komutunun eski Plugin bağımlılık kalıntılarını harness tarafı bir postinstall onarımı olmadan temizlediğini doğrular.
-
pnpm test:parallels:npm-update-
Native paketlenmiş kurulum güncelleme smoke testini Parallels konukları genelinde çalıştırır. Seçilen her platform önce istenen baseline paketini kurar, ardından aynı konukta kurulu
openclaw updatekomutunu çalıştırır ve kurulu sürümü, güncelleme durumunu, Gateway hazır olma durumunu ve bir yerel ajan turunu doğrular. -
Tek bir konuk üzerinde iterasyon yaparken
--platform macos,--platform windowsveya--platform linuxkullanın. Özet artifact yolu ve hat başına durum için--jsonkullanın. -
OpenAI hattı, varsayılan olarak canlı ajan turu kanıtı için
openai/gpt-5.5kullanır. Bilinçli olarak başka bir OpenAI modelini doğrularken--model <provider/model>geçirin veyaOPENCLAW_PARALLELS_OPENAI_MODELayarlayın. -
Parallels taşıma takılmalarının test penceresinin geri kalanını tüketmemesi için uzun yerel çalıştırmaları ana makine timeout'u ile sarın:
bash timeout --foreground 150m pnpm test:parallels:npm-update -- --jsontimeout --foreground 90m pnpm test:parallels:npm-update -- --platform windows --json -
Script iç içe hat günlüklerini
/tmp/openclaw-parallels-npm-update.*altında yazar. Dış sarmalayıcının takıldığını varsaymadan öncewindows-update.log,macos-update.logveyalinux-update.logdosyasını inceleyin. -
Windows güncellemesi soğuk bir konukta güncelleme sonrası doctor ve paket güncelleme çalışmasında 10 ila 15 dakika harcayabilir; iç içe npm debug günlüğü ilerliyorsa bu hâlâ sağlıklıdır.
-
Bu aggregate sarmalayıcıyı bireysel Parallels macOS, Windows veya Linux smoke hatlarıyla paralel çalıştırmayın. VM durumunu paylaşırlar ve snapshot geri yükleme, paket sunumu veya konuk Gateway durumu üzerinde çakışabilirler.
-
Güncelleme sonrası kanıt normal paketlenmiş Plugin yüzeyini çalıştırır, çünkü konuşma, görüntü oluşturma ve medya anlama gibi capability facade'ları, ajan turunun kendisi yalnızca basit bir metin yanıtını denetlese bile paketlenmiş çalışma zamanı API'leri üzerinden yüklenir.
-
-
pnpm openclaw qa aimock- Doğrudan protokol smoke testi için yalnızca yerel AIMock sağlayıcı sunucusunu başlatır.
-
pnpm openclaw qa matrix- Matrix canlı QA hattını tek kullanımlık Docker destekli bir Tuwunel
homeserver'a karşı çalıştırır. Yalnızca kaynak checkout'u - paketlenmiş
kurulumlar
qa-labgöndermez. - Tam CLI, profil/senaryo kataloğu, env vars ve artifact düzeni: Matrix QA.
- Matrix canlı QA hattını tek kullanımlık Docker destekli bir Tuwunel
homeserver'a karşı çalıştırır. Yalnızca kaynak checkout'u - paketlenmiş
kurulumlar
-
pnpm openclaw qa telegram- Telegram canlı QA hattını, env'den gelen sürücü ve SUT bot token'larını kullanarak gerçek bir özel gruba karşı çalıştırır.
OPENCLAW_QA_TELEGRAM_GROUP_ID,OPENCLAW_QA_TELEGRAM_DRIVER_BOT_TOKENveOPENCLAW_QA_TELEGRAM_SUT_BOT_TOKENgerektirir. Grup id'si sayısal Telegram sohbet id'si olmalıdır.- Paylaşılan havuz kimlik bilgileri için
--credential-source convexdestekler. Varsayılan olarak env modunu kullanın veya havuz lease'lerine katılmak içinOPENCLAW_QA_CREDENTIAL_SOURCE=convexayarlayın. - Varsayılanlar canary, mention gating, command addressing,
/status, bot-to-bot belirtilmiş yanıtlar ve core native komut yanıtlarını kapsar.mock-openaivarsayılanları ayrıca deterministik reply-chain ve Telegram final-message streaming regresyonlarını kapsar.session_statusgibi isteğe bağlı yoklamalar için--list-scenarioskullanın. - Herhangi bir senaryo başarısız olduğunda sıfır olmayan kodla çıkar. Hata
veren bir çıkış kodu olmadan artifact istediğinizde
--allow-failureskullanın. - Aynı özel grupta iki farklı bot ve SUT botunun bir Telegram kullanıcı adı sunmasını gerektirir.
- Kararlı bot-to-bot gözlemi için her iki botta da
@BotFatheriçinde Bot-to-Bot Communication Mode'u etkinleştirin ve sürücü botun grup bot trafiğini gözlemleyebildiğinden emin olun. .artifacts/qa-e2e/...altında bir Telegram QA raporu, özeti ve gözlenen mesajlar artifact'i yazar. Yanıt veren senaryolar, sürücü gönderme isteğinden gözlenen SUT yanıtına kadar RTT içerir.
Mantis Telegram Live, bu hattın çevresindeki PR kanıtı sarmalayıcısıdır. Aday
ref'i Convex lease'li Telegram kimlik bilgileriyle çalıştırır, redakte edilmiş
gözlenen mesaj transcript'ini Crabbox masaüstü tarayıcısında render eder, MP4
kanıtı kaydeder, hareket kırpılmış bir GIF oluşturur, artifact paketini yükler ve
pr_number ayarlandığında Mantis GitHub App üzerinden satır içi PR kanıtı
gönderir. Maintainer'lar bunu Actions UI üzerinden Mantis Scenario
(scenario_id: telegram-live) ile veya doğrudan bir pull request yorumundan
başlatabilir:
@Mantis telegram@Mantis telegram scenario=telegram-status-command@Mantis telegram scenarios=telegram-status-command,telegram-mentioned-message-replyMantis Telegram Desktop Proof, PR görsel kanıtı için ajanlı native Telegram
Desktop önce/sonra sarmalayıcısıdır. Actions UI üzerinden serbest biçimli
instructions ile, Mantis Scenario (scenario_id: telegram-desktop-proof)
üzerinden veya bir PR yorumundan başlatın:
@Mantis telegram desktop proofMantis ajanı PR'ı okur, değişikliği hangi Telegram görünür davranışının
kanıtladığına karar verir, temel ve aday ref'lerde gerçek kullanıcı Crabbox Telegram Desktop
kanıt hattını çalıştırır, yerel GIF'ler işe yarar hale gelene kadar yineler, eşleştirilmiş bir
motionPreview manifesti yazar ve pr_number ayarlandığında aynı 2 sütunlu GIF tablosunu
Mantis GitHub App üzerinden gönderir.
pnpm openclaw qa mantis telegram-desktop-builder- Bir Crabbox Linux masaüstü kiralar veya yeniden kullanır, yerel Telegram Desktop'ı kurar, OpenClaw'ı kiralanmış bir Telegram SUT bot belirteciyle yapılandırır, Gateway'i başlatır ve görünür VNC masaüstünden ekran görüntüsü/MP4 kanıtı kaydeder.
- Varsayılan olarak
--credential-source convexkullanır; böylece iş akışları yalnızca Convex aracı sırrına ihtiyaç duyar.pnpm openclaw qa telegramile aynıOPENCLAW_QA_TELEGRAM_*değişkenleriyle--credential-source envkullanın. - Telegram Desktop hâlâ bir kullanıcı oturumu/profili gerektirir. Bot belirteci yalnızca OpenClaw'ı yapılandırır. base64
.tgzprofil arşivi için--telegram-profile-archive-env <name>kullanın veya--keep-leasekullanıp VNC üzerinden bir kez elle oturum açın. - Çıktı dizini altında
mantis-telegram-desktop-builder-report.md,mantis-telegram-desktop-builder-summary.json,telegram-desktop-builder.pngvetelegram-desktop-builder.mp4yazar.
Canlı taşıma hatları tek bir standart sözleşmeyi paylaşır; böylece yeni taşıyıcılar sapmaz. Hat başına kapsam matrisi QA overview → Live transport coverage bölümünde yer alır. qa-channel geniş sentetik pakettir ve bu matrisin parçası değildir.
Convex üzerinden paylaşılan Telegram kimlik bilgileri (v1)
Canlı taşıma QA için --credential-source convex (veya OPENCLAW_QA_CREDENTIAL_SOURCE=convex)
etkinleştirildiğinde, QA lab Convex destekli bir havuzdan özel bir kira alır, hat çalışırken
bu kiraya Heartbeat gönderir ve kapanışta kirayı serbest bırakır. Bölüm adı
Discord, Slack ve WhatsApp desteğinden önce gelir; kira sözleşmesi türler arasında ortaktır.
Referans Convex proje iskelesi:
qa/convex-credential-broker/
Gerekli env değişkenleri:
OPENCLAW_QA_CONVEX_SITE_URL(örneğinhttps://your-deployment.convex.site)- Seçilen rol için bir sır:
OPENCLAW_QA_CONVEX_SECRET_MAINTAINER,maintaineriçinOPENCLAW_QA_CONVEX_SECRET_CI,ciiçin
- Kimlik bilgisi rol seçimi:
- CLI:
--credential-role maintainer|ci - Env varsayılanı:
OPENCLAW_QA_CREDENTIAL_ROLE(CI'da varsayılanci, aksi haldemaintainer)
- CLI:
İsteğe bağlı env değişkenleri:
OPENCLAW_QA_CREDENTIAL_LEASE_TTL_MS(varsayılan1200000)OPENCLAW_QA_CREDENTIAL_HEARTBEAT_INTERVAL_MS(varsayılan30000)OPENCLAW_QA_CREDENTIAL_ACQUIRE_TIMEOUT_MS(varsayılan90000)OPENCLAW_QA_CREDENTIAL_HTTP_TIMEOUT_MS(varsayılan15000)OPENCLAW_QA_CONVEX_ENDPOINT_PREFIX(varsayılan/qa-credentials/v1)OPENCLAW_QA_CREDENTIAL_OWNER_ID(isteğe bağlı iz kimliği)OPENCLAW_QA_ALLOW_INSECURE_HTTP=1, yalnızca yerel geliştirme için loopbackhttp://Convex URL'lerine izin verir.
Normal çalışmada OPENCLAW_QA_CONVEX_SITE_URL https:// kullanmalıdır.
Bakımcı yönetici komutları (havuz ekleme/kaldırma/listeleme) özellikle
OPENCLAW_QA_CONVEX_SECRET_MAINTAINER gerektirir.
Bakımcılar için CLI yardımcıları:
pnpm openclaw qa credentials doctorpnpm openclaw qa credentials add --kind telegram --payload-file qa/telegram-credential.jsonpnpm openclaw qa credentials list --kind telegrampnpm openclaw qa credentials remove --credential-id <credential-id>Canlı çalıştırmalardan önce Convex site URL'sini, aracı sırlarını,
uç nokta önekini, HTTP zaman aşımını ve yönetici/liste erişilebilirliğini
sır değerlerini yazdırmadan denetlemek için doctor kullanın. Betiklerde ve CI
yardımcılarında makine tarafından okunabilir çıktı için --json kullanın.
Varsayılan uç nokta sözleşmesi (OPENCLAW_QA_CONVEX_SITE_URL + /qa-credentials/v1):
POST /acquire- İstek:
{ kind, ownerId, actorRole, leaseTtlMs, heartbeatIntervalMs } - Başarılı:
{ status: "ok", credentialId, leaseToken, payload, leaseTtlMs?, heartbeatIntervalMs? } - Tükenmiş/yeniden denenebilir:
{ status: "error", code: "POOL_EXHAUSTED" | "NO_CREDENTIAL_AVAILABLE", ... }
- İstek:
POST /payload-chunk- İstek:
{ kind, ownerId, actorRole, credentialId, leaseToken, index } - Başarılı:
{ status: "ok", index, data }
- İstek:
POST /heartbeat- İstek:
{ kind, ownerId, actorRole, credentialId, leaseToken, leaseTtlMs } - Başarılı:
{ status: "ok" }(veya boş2xx)
- İstek:
POST /release- İstek:
{ kind, ownerId, actorRole, credentialId, leaseToken } - Başarılı:
{ status: "ok" }(veya boş2xx)
- İstek:
POST /admin/add(yalnızca bakımcı sırrı)- İstek:
{ kind, actorId, payload, note?, status? } - Başarılı:
{ status: "ok", credential }
- İstek:
POST /admin/remove(yalnızca bakımcı sırrı)- İstek:
{ credentialId, actorId } - Başarılı:
{ status: "ok", changed, credential } - Etkin kira koruması:
{ status: "error", code: "LEASE_ACTIVE", ... }
- İstek:
POST /admin/list(yalnızca bakımcı sırrı)- İstek:
{ kind?, status?, includePayload?, limit? } - Başarılı:
{ status: "ok", credentials, count }
- İstek:
Telegram türü için yük biçimi:
{ groupId: string, driverToken: string, sutToken: string }groupIdsayısal bir Telegram sohbet kimliği dizesi olmalıdır.admin/add,kind: "telegram"için bu biçimi doğrular ve hatalı biçimlendirilmiş yükleri reddeder.
Telegram gerçek kullanıcı türü için yük biçimi:
{ groupId: string, sutToken: string, testerUserId: string, testerUsername: string, telegramApiId: string, telegramApiHash: string, tdlibDatabaseEncryptionKey: string, tdlibArchiveBase64: string, tdlibArchiveSha256: string, desktopTdataArchiveBase64: string, desktopTdataArchiveSha256: string }groupId,testerUserIdvetelegramApiIdsayısal dizeler olmalıdır.tdlibArchiveSha256vedesktopTdataArchiveSha256SHA-256 hex dizeleri olmalıdır.kind: "telegram-user"bir Telegram geçici hesabını temsil eder. Kirayı hesap genelinde kabul edin: TDLib CLI sürücüsü ve Telegram Desktop görsel tanığı aynı yükten geri yüklenir ve aynı anda yalnızca bir iş kirayı tutmalıdır.
Telegram gerçek kullanıcı kira geri yüklemesi:
tmp=$(mktemp -d /tmp/openclaw-telegram-user.XXXXXX)node --import tsx scripts/e2e/telegram-user-credential.ts lease-restore \ --user-driver-dir "$tmp/user-driver" \ --desktop-workdir "$tmp/desktop" \ --lease-file "$tmp/lease.json"TELEGRAM_USER_DRIVER_STATE_DIR="$tmp/user-driver" \ uv run ~/.codex/skills/custom/telegram-e2e-bot-to-bot/scripts/user-driver.py status --jsonnode --import tsx scripts/e2e/telegram-user-credential.ts release --lease-file "$tmp/lease.json"Görsel kayıt gerektiğinde geri yüklenmiş Desktop profilini Telegram -workdir "$tmp/desktop" ile kullanın. Yerel operatör ortamlarında, süreç env değişkenleri yoksa scripts/e2e/telegram-user-credential.ts varsayılan olarak ~/.codex/skills/custom/telegram-e2e-bot-to-bot/convex.local.env dosyasını okur.
Ajan güdümlü Crabbox oturumu:
pnpm qa:telegram-user:crabbox -- start \ --tdlib-url http://artifacts.openclaw.ai/tdlib-v1.8.0-linux-x64.tgz \ --output-dir .artifacts/qa-e2e/telegram-user-crabbox/pr-reviewpnpm qa:telegram-user:crabbox -- send \ --session .artifacts/qa-e2e/telegram-user-crabbox/pr-review/session.json \ --text /statuspnpm qa:telegram-user:crabbox -- finish \ --session .artifacts/qa-e2e/telegram-user-crabbox/pr-review/session.jsonstart, telegram-user kimlik bilgisini kiralar, aynı hesabı bir Crabbox Linux masaüstünde
TDLib ve Telegram Desktop içine geri yükler, mevcut checkout'tan yerel bir sahte SUT
Gateway başlatır, görünür Telegram sohbetini açar, masaüstü kaydını
başlatır ve özel bir session.json yazar. Oturum canlıyken bir ajan
tatmin olana kadar test etmeye devam edebilir:
send --session <file> --text <message>, gerçek TDLib kullanıcısı üzerinden gönderir ve SUT yanıtını bekler.run --session <file> -- <remote command>, Crabbox üzerinde rastgele bir komut çalıştırır ve çıktısını kaydeder; örneğinbash -lc 'source /tmp/openclaw-telegram-user-crabbox/env.sh && python3 /tmp/openclaw-telegram-user-crabbox/user-driver.py transcript --limit 20 --json'.screenshot --session <file>mevcut görünür masaüstünü yakalar.status --session <file>kirayı ve WebVNC komutunu yazdırır.finish --session <file>kaydediciyi durdurur, ekran görüntüsü/video/hareket-kırpma artifaktlarını yakalar, Convex kimlik bilgisini serbest bırakır, yerel SUT süreçlerini durdurur ve--keep-boxgeçirilmedikçe Crabbox kirasını durdurur.publish --session <file> --pr <number>varsayılan olarak yalnızca GIF içeren bir PR yorumu yayımlar. Günlükler veya JSON artifaktları kasıtlı olarak gerektiğinde yalnızca--full-artifactsgeçirin.
Deterministik görsel yeniden üretimler için start komutuna veya tek komutluk
probe kısayoluna --mock-response-file <path> geçirin. Çalıştırıcı varsayılan olarak standart bir
Crabbox sınıfı, 24fps kayıt, 24fps hareket GIF önizlemeleri ve 1920px GIF
genişliği kullanır. Yalnızca kanıt farklı yakalama ayarları gerektirdiğinde
--class, --record-fps, --preview-fps ve --preview-width ile geçersiz kılın.
Tek komutluk Crabbox kanıtı:
pnpm qa:telegram-user:crabbox -- --text /statusVarsayılan probe komutu, tek bir start/send/finish döngüsünün kısaltmasıdır. Hızlı bir
/status duman testi için kullanın. PR incelemesi, hata yeniden üretme çalışması
veya kanıtın tamamlandığına karar vermeden önce ajanın dakikalarca rastgele
deneme yapması gereken herhangi bir durum için oturum komutlarını kullanın. Sıcak bir masaüstü kirasını
yeniden kullanmak için --id <cbx_...>, bitirdikten sonra VNC'yi açık tutmak için --keep-box,
görünür sohbeti seçmek için --desktop-chat-title <name> ve taze bir kutuda TDLib derlemek yerine
önceden pişirilmiş Linux libtdjson.so arşivi kullanırken --tdlib-url <tgz>
kullanın. Çalıştırıcı --tdlib-url değerini --tdlib-sha256 <hex> ile veya
varsayılan olarak kardeş bir <url>.sha256 dosyasıyla doğrular.
Aracı tarafından doğrulanan çok kanallı yükler:
- Discord:
{ guildId: string, channelId: string, driverBotToken: string, sutBotToken: string, sutApplicationId: string, voiceChannelId?: string } - WhatsApp:
{ driverPhoneE164: string, sutPhoneE164: string, driverAuthArchiveBase64: string, sutAuthArchiveBase64: string, groupJid?: string }
Slack hatları da havuzdan kira alabilir, ancak Slack yük doğrulaması şu anda
aracı yerine Slack QA çalıştırıcısında yer alır. Slack satırları için
{ channelId: string, driverBotToken: string, sutBotToken: string, sutAppToken: string }
kullanın.
QA'ya kanal ekleme
Yeni kanal bağdaştırıcıları için mimari ve senaryo yardımcı adları QA overview → Adding a channel bölümünde yer alır. Asgari gereklilik: taşıma çalıştırıcısını paylaşılan qa-lab ana makine seam'i üzerinde uygulayın, Plugin manifestinde qaRunners bildirin, openclaw qa <runner> olarak bağlayın ve qa/scenarios/ altında senaryolar yazın.
Test paketleri (nerede ne çalışır)
Paketleri "artan gerçekçilik" (ve artan kırılganlık/maliyet) olarak düşünün:
Birim / entegrasyon (varsayılan)
- Komut:
pnpm test - Yapılandırma: hedeflenmemiş çalıştırmalar
vitest.full-*.config.tsshard setini kullanır ve paralel zamanlama için çok projeli shard'ları proje başına yapılandırmalara genişletebilir - Dosyalar:
src/**/*.test.ts,packages/**/*.test.tsvetest/**/*.test.tsaltında core/birim envanterleri; UI birim testleri özelunit-uishard'ında çalışır - Kapsam:
- Saf birim testleri
- Süreç içi entegrasyon testleri (Gateway kimlik doğrulaması, yönlendirme, araçlama, ayrıştırma, yapılandırma)
- Bilinen hatalar için deterministik regresyonlar
- Beklentiler:
- CI'da çalışır
- Gerçek anahtar gerektirmez
- Hızlı ve kararlı olmalıdır
- Çözümleyici ve genel yüzey yükleyici testleri, geniş
api.jsveruntime-api.jsyedek davranışını gerçek paketlenmiş Plugin kaynak API'leriyle değil, oluşturulmuş küçük Plugin fikstürleriyle kanıtlamalıdır. Gerçek Plugin API yükleri Plugin sahipli sözleşme/entegrasyon paketlerine aittir.
Yerel bağımlılık ilkesi:
- Varsayılan test kurulumları, isteğe bağlı yerel Discord opus derlemelerini atlar. Discord ses alma, saf JS
opusscriptkod çözücüsünü kullanır ve@discordjs/opus, yerel testlerin ve Testbox hatlarının yerel eklentiyi derlememesi içinallowBuildsiçinde devre dışı kalır. - Bilerek yerel bir opus derlemesini karşılaştırmanız gerekiyorsa ayrılmış bir Discord ses performansı veya canlı hattı kullanın. Varsayılan
allowBuildsiçinde@discordjs/opusdeğerinitrueyapmayın; bu, ilgisiz kurulum/test döngülerinin yerel kod derlemesine neden olur.
Projeler, parçalar ve kapsamlı hatlar
- Hedeflenmemiş
pnpm test, tek bir devasa yerel kök proje süreci yerine on iki daha küçük parça yapılandırmasını (core-unit-fast,core-unit-src,core-unit-security,core-unit-ui,core-unit-support,core-support-boundary,core-contracts,core-bundled,core-runtime,agentic,auto-reply,extensions) çalıştırır. Bu, yüklü makinelerde en yüksek RSS değerini düşürür ve auto-reply/uzantı işlerinin ilgisiz test kümelerini aç bırakmasını önler. pnpm test --watchhâlâ yerel kökvitest.config.tsproje grafiğini kullanır, çünkü çok parçalı bir izleme döngüsü pratik değildir.pnpm test,pnpm test:watchvepnpm test:perf:imports, açık dosya/dizin hedeflerini önce kapsamlı hatlardan geçirir; böylecepnpm test extensions/discord/src/monitor/message-handler.preflight.test.tstam kök proje başlangıç maliyetini ödemez.pnpm test:changed, değişen git yollarını varsayılan olarak ucuz kapsamlı hatlara genişletir: doğrudan test düzenlemeleri, kardeş*.test.tsdosyaları, açık kaynak eşlemeleri ve yerel içe aktarma grafiği bağımlıları. Yapılandırma/kurulum/paket düzenlemeleri, açıkçaOPENCLAW_TEST_CHANGED_BROAD=1 pnpm test:changedkullanmadığınız sürece testleri geniş kapsamda çalıştırmaz.pnpm check:changed, dar çalışmalar için normal akıllı yerel kontrol kapısıdır. Diff'i core, core testleri, uzantılar, uzantı testleri, uygulamalar, dokümanlar, yayın üst verileri, canlı Docker araçları ve araçlar olarak sınıflandırır; ardından eşleşen typecheck, lint ve koruma komutlarını çalıştırır. Vitest testlerini çalıştırmaz; test kanıtı içinpnpm test:changedveya açıkpnpm test <target>çağırın. Yalnızca yayın üst verisi olan sürüm artışları, en üst düzey sürüm alanı dışındaki paket değişikliklerini reddeden bir korumayla hedefli sürüm/yapılandırma/kök bağımlılık kontrollerini çalıştırır.- Canlı Docker ACP harness düzenlemeleri odaklı kontroller çalıştırır: canlı Docker auth betikleri için shell sözdizimi ve canlı Docker zamanlayıcı kuru çalıştırması.
package.jsondeğişiklikleri yalnızca diffscripts["test:docker:live-*"]ile sınırlı olduğunda dahil edilir; bağımlılık, dışa aktarma, sürüm ve diğer paket yüzeyi düzenlemeleri hâlâ daha geniş korumaları kullanır. - Agents, komutlar, Plugin'ler, auto-reply yardımcıları,
plugin-sdkve benzer saf yardımcı alanlardan içe aktarma açısından hafif birim testleri,test/setup-openclaw-runtime.tsdosyasını atlayanunit-fasthattından geçer; durumlu/çalışma zamanı açısından ağır dosyalar mevcut hatlarda kalır. - Seçili
plugin-sdkvecommandsyardımcı kaynak dosyaları da changed-mode çalıştırmalarını bu hafif hatlardaki açık kardeş testlere eşler; böylece yardımcı düzenlemeleri o dizin için tam ağır test kümesini yeniden çalıştırmaktan kaçınır. auto-reply, üst düzey core yardımcıları, üst düzeyreply.*entegrasyon testleri vesrc/auto-reply/reply/**alt ağacı için ayrılmış kovalara sahiptir. CI ayrıca reply alt ağacını agent-runner, dispatch ve commands/state-routing parçalarına böler; böylece içe aktarma açısından ağır tek bir kova tüm Node kuyruğunu üstlenmez.- Normal PR/main CI, uzantı toplu taramasını ve yalnızca yayına özel
agentic-pluginsparçasını kasıtlı olarak atlar. Tam Yayın Doğrulaması, yayın adaylarında bu Plugin/uzantı ağırlıklı test kümeleri için ayrıPlugin Prereleasealt iş akışını tetikler.
Gömülü çalıştırıcı kapsamı
- İleti aracı keşif girdilerini veya compaction çalışma zamanı bağlamını değiştirdiğinizde, her iki kapsam düzeyini de koruyun.
- Saf yönlendirme ve normalleştirme sınırları için odaklı yardımcı regresyonları ekleyin.
- Gömülü çalıştırıcı entegrasyon test kümelerini sağlıklı tutun:
src/agents/pi-embedded-runner/compact.hooks.test.ts,src/agents/pi-embedded-runner/run.overflow-compaction.test.tsvesrc/agents/pi-embedded-runner/run.overflow-compaction.loop.test.ts. - Bu test kümeleri, kapsamlı kimliklerin ve compaction davranışının gerçek
run.ts/compact.tsyollarından hâlâ aktığını doğrular; yalnızca yardımcı testleri bu entegrasyon yollarının yeterli yerine geçmez.
Vitest havuzu ve izolasyon varsayılanları
- Temel Vitest yapılandırması varsayılan olarak
threadskullanır. - Paylaşılan Vitest yapılandırması
isolate: falsedeğerini sabitler ve kök projeler, e2e ve canlı yapılandırmalar genelinde izole olmayan çalıştırıcıyı kullanır. - Kök UI hattı
jsdomkurulumunu ve optimizer'ını korur, ancak o da paylaşılan izole olmayan çalıştırıcıda çalışır. - Her
pnpm testparçası, paylaşılan Vitest yapılandırmasından aynıthreads+isolate: falsevarsayılanlarını devralır. scripts/run-vitest.mjs, büyük yerel çalıştırmalar sırasında V8 derleme dalgalanmasını azaltmak için Vitest alt Node süreçlerine varsayılan olarak--no-maglevekler. Standart V8 davranışıyla karşılaştırmak içinOPENCLAW_VITEST_ENABLE_MAGLEV=1ayarlayın.
Hızlı yerel yineleme
pnpm changed:lanes, bir diff'in hangi mimari hatları tetiklediğini gösterir.- Pre-commit hook yalnızca biçimlendirme yapar. Biçimlendirilmiş dosyaları yeniden stage eder ve lint, typecheck ya da test çalıştırmaz.
- Devirden veya push'tan önce akıllı yerel kontrol kapısına ihtiyacınız
olduğunda açıkça
pnpm check:changedçalıştırın. pnpm test:changed, varsayılan olarak ucuz kapsamlı hatlardan geçer.OPENCLAW_TEST_CHANGED_BROAD=1 pnpm test:changedkomutunu yalnızca agent bir harness, yapılandırma, paket veya sözleşme düzenlemesinin gerçekten daha geniş Vitest kapsamına ihtiyaç duyduğuna karar verdiğinde kullanın.pnpm test:maxvepnpm test:changed:max, yalnızca daha yüksek bir worker sınırıyla aynı yönlendirme davranışını korur.- Yerel worker otomatik ölçeklendirmesi kasıtlı olarak muhafazakârdır ve host yük ortalaması zaten yüksek olduğunda geri çekilir; böylece birden fazla eşzamanlı Vitest çalıştırması varsayılan olarak daha az zarar verir.
- Temel Vitest yapılandırması, test bağlantıları değiştiğinde changed-mode
yeniden çalıştırmaların doğru kalması için projeleri/yapılandırma
dosyalarını
forceRerunTriggersolarak işaretler. - Yapılandırma, desteklenen host'larda
OPENCLAW_VITEST_FS_MODULE_CACHEözelliğini etkin tutar; doğrudan profilleme için tek bir açık önbellek konumu istiyorsanızOPENCLAW_VITEST_FS_MODULE_CACHE_PATH=/abs/pathayarlayın.
Performans hata ayıklama
pnpm test:perf:imports, Vitest içe aktarma süresi raporlamasını ve içe aktarma dökümü çıktısını etkinleştirir.pnpm test:perf:imports:changed, aynı profilleme görünümünüorigin/mainsonrasında değişen dosyalarla kapsamlandırır.- Parça zamanlama verileri
.artifacts/vitest-shard-timings.jsondosyasına yazılır. Tüm yapılandırma çalıştırmaları anahtar olarak yapılandırma yolunu kullanır; include-pattern CI parçaları, filtrelenmiş parçaların ayrı izlenebilmesi için parça adını ekler. - Sıcak bir test hâlâ zamanının çoğunu başlangıç içe aktarmalarında
harcıyorsa, ağır bağımlılıkları dar bir yerel
*.runtime.tsseam'inin arkasında tutun ve çalışma zamanı yardımcılarını yalnızcavi.mock(...)içinden geçirmek için derin içe aktarmak yerine bu seam'i doğrudan mock'layın. pnpm test:perf:changed:bench -- --ref <git-ref>, yönlendirilmiştest:changedçalışmasını o commit'lenmiş diff için yerel kök proje yoluyla karşılaştırır ve duvar süresini artı macOS maksimum RSS değerini yazdırır.pnpm test:perf:changed:bench -- --worktree, değişen dosya listesiniscripts/test-projects.mjsve kök Vitest yapılandırması üzerinden yönlendirerek mevcut kirli ağacı benchmark eder.pnpm test:perf:profile:main, Vitest/Vite başlangıcı ve transform yükü için bir ana iş parçacığı CPU profili yazar.pnpm test:perf:profile:runner, dosya paralelliği devre dışı bırakılmış birim test kümesi için çalıştırıcı CPU+heap profilleri yazar.
Kararlılık (gateway)
- Komut:
pnpm test:stability:gateway - Yapılandırma:
vitest.gateway.config.ts, tek worker'a zorlanır - Kapsam:
- Varsayılan olarak tanılamalar etkinleştirilmiş gerçek bir local loopback Gateway başlatır
- Tanılama olay yolu üzerinden sentetik gateway ileti, bellek ve büyük yük dalgalanmasını sürer
- Gateway WS RPC üzerinden
diagnostics.stabilitysorgular - Tanılama kararlılık paketi kalıcılık yardımcılarını kapsar
- Kaydedicinin sınırlı kaldığını, sentetik RSS örneklerinin basınç bütçesinin altında kaldığını ve oturum başına kuyruk derinliklerinin yeniden sıfıra indiğini doğrular
- Beklentiler:
- CI için güvenli ve anahtarsız
- Kararlılık regresyonu takibi için dar hat; tam Gateway test kümesinin yerine geçmez
E2E (gateway smoke)
- Komut:
pnpm test:e2e - Yapılandırma:
vitest.e2e.config.ts - Dosyalar:
src/**/*.e2e.test.ts,test/**/*.e2e.test.tsveextensions/altındaki paketlenmiş Plugin E2E testleri - Çalışma zamanı varsayılanları:
- Repo'nun geri kalanıyla eşleşecek şekilde Vitest
threadsileisolate: falsekullanır. - Uyarlanabilir worker'lar kullanır (CI: en fazla 2, yerel: varsayılan olarak 1).
- Konsol G/Ç yükünü azaltmak için varsayılan olarak sessiz modda çalışır.
- Repo'nun geri kalanıyla eşleşecek şekilde Vitest
- Yararlı geçersiz kılmalar:
- Worker sayısını zorlamak için
OPENCLAW_E2E_WORKERS=<n>(16 ile sınırlıdır). - Ayrıntılı konsol çıktısını yeniden etkinleştirmek için
OPENCLAW_E2E_VERBOSE=1.
- Worker sayısını zorlamak için
- Kapsam:
- Çok örnekli gateway uçtan uca davranışı
- WebSocket/HTTP yüzeyleri, node eşleştirme ve daha ağır ağ işlemleri
- Beklentiler:
- CI'da çalışır (pipeline içinde etkinleştirildiğinde)
- Gerçek anahtar gerekmez
- Birim testlerinden daha fazla hareketli parça içerir (daha yavaş olabilir)
E2E: OpenShell arka uç smoke
- Komut:
pnpm test:e2e:openshell - Dosya:
extensions/openshell/src/backend.e2e.test.ts - Kapsam:
- Host üzerinde Docker aracılığıyla izole bir OpenShell gateway başlatır
- Geçici bir yerel Dockerfile'dan sandbox oluşturur
- OpenClaw'ın OpenShell arka ucunu gerçek
sandbox ssh-config+ SSH exec üzerinden çalıştırır - Sandbox fs köprüsü üzerinden uzak-kanonik dosya sistemi davranışını doğrular
- Beklentiler:
- Yalnızca isteğe bağlıdır; varsayılan
pnpm test:e2eçalıştırmasının parçası değildir - Yerel bir
openshellCLI ve çalışan bir Docker daemon gerektirir - İzole
HOME/XDG_CONFIG_HOMEkullanır, ardından test gateway'ini ve sandbox'ı yok eder
- Yalnızca isteğe bağlıdır; varsayılan
- Yararlı geçersiz kılmalar:
- Daha geniş e2e test kümesini elle çalıştırırken testi etkinleştirmek için
OPENCLAW_E2E_OPENSHELL=1 - Varsayılan olmayan bir CLI binary'sine veya sarmalayıcı betiğe işaret etmek için
OPENCLAW_E2E_OPENSHELL_COMMAND=/path/to/openshell
- Daha geniş e2e test kümesini elle çalıştırırken testi etkinleştirmek için
Canlı (gerçek sağlayıcılar + gerçek modeller)
- Komut:
pnpm test:live - Yapılandırma:
vitest.live.config.ts - Dosyalar:
src/**/*.live.test.ts,test/**/*.live.test.tsveextensions/altındaki paketle gelen Plugin canlı testleri - Varsayılan:
pnpm test:livetarafından etkinleştirilir (OPENCLAW_LIVE_TEST=1ayarlar) - Kapsam:
- "Bu sağlayıcı/model gerçek kimlik bilgileriyle bugün gerçekten çalışıyor mu?"
- Sağlayıcı formatı değişikliklerini, araç çağırma tuhaflıklarını, kimlik doğrulama sorunlarını ve hız sınırı davranışını yakalayın
- Beklentiler:
- Tasarım gereği CI açısından kararlı değildir (gerçek ağlar, gerçek sağlayıcı ilkeleri, kotalar, kesintiler)
- Para harcar / hız sınırlarını kullanır
- "Her şey" yerine daraltılmış alt kümeler çalıştırmayı tercih edin
- Canlı çalıştırmalar, eksik API anahtarlarını almak için
~/.profilekaynağını kullanır. - Varsayılan olarak canlı çalıştırmalar yine de
HOMEdeğerini izole eder ve yapılandırma/kimlik doğrulama materyalini geçici bir test giriş dizinine kopyalar; böylece birim fixture'ları gerçek~/.openclawdizininizi değiştiremez. OPENCLAW_LIVE_USE_REAL_HOME=1değerini yalnızca canlı testlerin gerçek giriş dizininizi kullanmasını bilinçli olarak istediğinizde ayarlayın.pnpm test:liveartık varsayılan olarak daha sessiz bir moda geçer:[live] ...ilerleme çıktısını tutar, ancak ek~/.profilebildirimini bastırır ve Gateway önyükleme günlüklerini/Bonjour konuşmalarını sessize alır. Tam başlangıç günlüklerini geri istiyorsanızOPENCLAW_LIVE_TEST_QUIET=0ayarlayın.- API anahtarı döndürme (sağlayıcıya özel): virgül/noktalı virgül formatıyla
*_API_KEYSveya*_API_KEY_1,*_API_KEY_2(örneğinOPENAI_API_KEYS,ANTHROPIC_API_KEYS,GEMINI_API_KEYS) ayarlayın ya daOPENCLAW_LIVE_*_KEYüzerinden canlıya özel geçersiz kılma kullanın; testler hız sınırı yanıtlarında yeniden dener. - İlerleme/Heartbeat çıktısı:
- Canlı paketler artık stderr'e ilerleme satırları yayar; böylece uzun sağlayıcı çağrıları, Vitest konsol yakalama sessiz olsa bile görünür biçimde etkin kalır.
vitest.live.config.ts, canlı çalıştırmalar sırasında sağlayıcı/Gateway ilerleme satırlarının hemen akması için Vitest konsol müdahalesini devre dışı bırakır.- Doğrudan model Heartbeat'lerini
OPENCLAW_LIVE_HEARTBEAT_MSile ayarlayın. - Gateway/prob Heartbeat'lerini
OPENCLAW_LIVE_GATEWAY_HEARTBEAT_MSile ayarlayın.
Hangi paketi çalıştırmalıyım?
Bu karar tablosunu kullanın:
- Mantık/test düzenleme:
pnpm testçalıştırın (çok fazla şey değiştirdiysenizpnpm test:coverageda çalıştırın) - Gateway ağına / WS protokolüne / eşleştirmeye dokunma:
pnpm test:e2eekleyin - "botum kapalı" / sağlayıcıya özel hatalar / araç çağırma hata ayıklaması: daraltılmış bir
pnpm test:liveçalıştırın
Canlı (ağa dokunan) testler
Canlı model matrisi, CLI arka uç smoke testleri, ACP smoke testleri, Codex uygulama sunucusu harness'ı ve tüm medya sağlayıcısı canlı testleri (Deepgram, BytePlus, ComfyUI, görüntü, müzik, video, medya harness'ı) ile canlı çalıştırmalar için kimlik bilgisi yönetimi için bkz. Canlı paketleri test etme. Özel güncelleme ve Plugin doğrulama kontrol listesi için bkz. Güncellemeleri ve Plugin'leri test etme.
Docker çalıştırıcıları (isteğe bağlı "Linux'ta çalışıyor" kontrolleri)
Bu Docker çalıştırıcıları iki gruba ayrılır:
- Canlı model çalıştırıcıları:
test:docker:live-modelsvetest:docker:live-gateway, yerel yapılandırma dizininizi ve çalışma alanınızı bağlayarak (ve bağlanmışsa~/.profilekaynağını kullanarak) repo Docker görüntüsünün içinde yalnızca eşleşen profil anahtarlı canlı dosyalarını çalıştırır (src/agents/models.profiles.live.test.tsvesrc/gateway/gateway-models.profiles.live.test.ts). Eşleşen yerel giriş noktalarıtest:live:models-profilesvetest:live:gateway-profilesdeğerleridir. - Docker canlı çalıştırıcıları varsayılan olarak daha küçük bir smoke sınırına geçer; böylece tam Docker taraması pratik kalır:
test:docker:live-modelsvarsayılan olarakOPENCLAW_LIVE_MAX_MODELS=12kullanır vetest:docker:live-gatewayvarsayılan olarakOPENCLAW_LIVE_GATEWAY_SMOKE=1,OPENCLAW_LIVE_GATEWAY_MAX_MODELS=8,OPENCLAW_LIVE_GATEWAY_STEP_TIMEOUT_MS=45000veOPENCLAW_LIVE_GATEWAY_MODEL_TIMEOUT_MS=90000kullanır. Özellikle daha büyük kapsamlı taramayı istediğinizde bu env vars değerlerini geçersiz kılın. test:docker:all, canlı Docker görüntüsünütest:docker:live-buildüzerinden bir kez derler,scripts/package-openclaw-for-docker.mjsaracılığıyla OpenClaw'ı npm tarball olarak bir kez paketler, ardından ikiscripts/e2e/Dockerfilegörüntüsü derler/yeniden kullanır. Yalın görüntü, install/update/plugin-dependency şeritleri için yalnızca Node/Git çalıştırıcısıdır; bu şeritler önceden derlenmiş tarball'ı bağlar. İşlevsel görüntü, derlenmiş uygulama işlevselliği şeritleri için aynı tarball'ı/appiçine yükler. Docker şerit tanımlarıscripts/lib/docker-e2e-scenarios.mjsiçinde yaşar; planlayıcı mantığıscripts/lib/docker-e2e-plan.mjsiçinde yaşar;scripts/test-docker-all.mjsseçilen planı yürütür. Toplam, ağırlıklı bir yerel zamanlayıcı kullanır:OPENCLAW_DOCKER_ALL_PARALLELISMişlem yuvalarını kontrol ederken, kaynak sınırları ağır canlı, npm-install ve çok servisli şeritlerin hepsinin aynı anda başlamasını engeller. Tek bir şerit etkin sınırların üzerindeyse zamanlayıcı, havuz boşken yine de onu başlatabilir ve ardından kapasite yeniden kullanılabilir olana kadar onu tek başına çalıştırmaya devam eder. Varsayılanlar 10 yuva,OPENCLAW_DOCKER_ALL_LIVE_LIMIT=9,OPENCLAW_DOCKER_ALL_NPM_LIMIT=10veOPENCLAW_DOCKER_ALL_SERVICE_LIMIT=7değerleridir;OPENCLAW_DOCKER_ALL_WEIGHT_LIMITveyaOPENCLAW_DOCKER_ALL_DOCKER_LIMITdeğerlerini yalnızca Docker konağında daha fazla pay olduğunda ayarlayın. Çalıştırıcı varsayılan olarak Docker ön kontrolü yapar, eski OpenClaw E2E konteynerlerini kaldırır, her 30 saniyede bir durum yazdırır, başarılı şerit sürelerini.artifacts/docker-tests/lane-timings.jsoniçinde saklar ve sonraki çalıştırmalarda daha uzun şeritleri önce başlatmak için bu süreleri kullanır. Docker derlemeden veya çalıştırmadan ağırlıklı şerit bildirimini yazdırmak içinOPENCLAW_DOCKER_ALL_DRY_RUN=1kullanın ya da seçilen şeritler, paket/görüntü gereksinimleri ve kimlik bilgileri için CI planını yazdırmak üzerenode scripts/test-docker-all.mjs --plan-jsonçalıştırın.Package Acceptance, "bu kurulabilir tarball bir ürün olarak çalışıyor mu?" sorusu için GitHub yerel paket kapısıdır.source=npm,source=ref,source=urlveyasource=artifactiçinden bir aday paketi çözer, bunupackage-under-testolarak yükler, ardından seçilen ref'i yeniden paketlemek yerine yeniden kullanılabilir Docker E2E şeritlerini tam olarak bu tarball'a karşı çalıştırır. Profiller kapsam genişliğine göre sıralanır:smoke,package,productvefull. Paket/güncelleme/Plugin sözleşmesi, yayımlanmış yükseltme sağ kalan matrisi, sürüm varsayılanları ve hata triyajı için bkz. Güncellemeleri ve Plugin'leri test etme.- Derleme ve yayın kontrolleri tsdown sonrasında
scripts/check-cli-bootstrap-imports.mjsçalıştırır. Koruma,dist/entry.jsvedist/cli/run-main.jsüzerinden statik derlenmiş grafiği gezer ve komut dağıtımından önceki başlangıcın, komut dağıtımından önce Commander, prompt UI, undici veya günlükleme gibi paket bağımlılıklarını içe aktarması durumunda başarısız olur; ayrıca paketlenmiş Gateway çalıştırma parçasını bütçe altında tutar ve bilinen soğuk Gateway yollarının statik içe aktarmalarını reddeder. Paketlenmiş CLI smoke testi ayrıca kök yardımını, onboard yardımını, doctor yardımını, durumu, yapılandırma şemasını ve bir model listesi komutunu kapsar. - Package Acceptance eski uyumluluğu
2026.4.25ile sınırlıdır (2026.4.25-beta.*dahil). Bu kesim tarihine kadar harness yalnızca gönderilmiş paket meta verisi boşluklarını tolere eder: atlanmış özel QA envanter girdileri, eksikgateway install --wrapper, tarball türevi git fixture'ında eksik yama dosyaları, eksik kalıcıupdate.channel, eski Plugin kurulum kaydı konumları, eksik marketplace kurulum kaydı kalıcılığı veplugins updatesırasında yapılandırma meta verisi migrasyonu.2026.4.25sonrasındaki paketlerde bu yollar katı hatalardır. - Konteyner smoke çalıştırıcıları:
test:docker:openwebui,test:docker:onboard,test:docker:npm-onboard-channel-agent,test:docker:skill-install,test:docker:update-channel-switch,test:docker:upgrade-survivor,test:docker:published-upgrade-survivor,test:docker:session-runtime-context,test:docker:agents-delete-shared-workspace,test:docker:gateway-network,test:docker:browser-cdp-snapshot,test:docker:mcp-channels,test:docker:pi-bundle-mcp-tools,test:docker:cron-mcp-cleanup,test:docker:plugins,test:docker:plugin-update,test:docker:plugin-lifecycle-matrixvetest:docker:config-reloadbir veya daha fazla gerçek konteyneri başlatır ve daha üst düzey entegrasyon yollarını doğrular.
Canlı model Docker çalıştırıcıları ayrıca yalnızca gereken CLI kimlik doğrulama giriş dizinlerini (veya çalıştırma daraltılmamışsa desteklenenlerin tamamını) bind-mount eder, ardından çalıştırmadan önce bunları konteyner giriş dizinine kopyalar; böylece harici CLI OAuth, konak kimlik doğrulama deposunu değiştirmeden token'ları yenileyebilir:
- Doğrudan modeller:
pnpm test:docker:live-models(betik:scripts/test-live-models-docker.sh) - ACP bağlama smoke testi:
pnpm test:docker:live-acp-bind(betik:scripts/test-live-acp-bind-docker.sh; varsayılan olarak Claude, Codex ve Gemini’yi kapsar;pnpm test:docker:live-acp-bind:droidvepnpm test:docker:live-acp-bind:opencodeile sıkı Droid/OpenCode kapsamı sağlar) - CLI backend smoke testi:
pnpm test:docker:live-cli-backend(betik:scripts/test-live-cli-backend-docker.sh) - Codex app-server harness smoke testi:
pnpm test:docker:live-codex-harness(betik:scripts/test-live-codex-harness-docker.sh) - Gateway + dev agent:
pnpm test:docker:live-gateway(betik:scripts/test-live-gateway-models-docker.sh) - Gözlemlenebilirlik smoke testi:
pnpm qa:otel:smokeözel bir QA kaynak-checkout hattıdır. npm tarball QA Lab’i dışarıda bıraktığı için kasıtlı olarak paket Docker yayın hatlarının parçası değildir. - Open WebUI canlı smoke testi:
pnpm test:docker:openwebui(betik:scripts/e2e/openwebui-docker.sh) - Onboarding sihirbazı (TTY, tam iskelet oluşturma):
pnpm test:docker:onboard(betik:scripts/e2e/onboard-docker.sh) - Npm tarball onboarding/kanal/agent smoke testi:
pnpm test:docker:npm-onboard-channel-agent, paketlenmiş OpenClaw tarball’unu Docker’da global olarak kurar, OpenAI’yi env-ref onboarding üzerinden ve varsayılan olarak Telegram’ı yapılandırır, doctor çalıştırır ve bir mock’lanmış OpenAI agent turu çalıştırır. Önceden oluşturulmuş bir tarball’uOPENCLAW_CURRENT_PACKAGE_TGZ=/path/to/openclaw-*.tgzile yeniden kullanın, host yeniden derlemesiniOPENCLAW_NPM_ONBOARD_HOST_BUILD=0ile atlayın veya kanalıOPENCLAW_NPM_ONBOARD_CHANNEL=discordya daOPENCLAW_NPM_ONBOARD_CHANNEL=slackile değiştirin. - Skill kurulum smoke testi:
pnpm test:docker:skill-install, paketlenmiş OpenClaw tarball’unu Docker’da global olarak kurar, yapılandırmada yüklenen arşiv kurulumlarını devre dışı bırakır, aramadan mevcut canlı ClawHub skill slug’ını çözer, bunuopenclaw skills installile kurar ve kurulu skill ile.clawhubkaynak/kilit metadata’sını doğrular. - Güncelleme kanalı değiştirme smoke testi:
pnpm test:docker:update-channel-switch, paketlenmiş OpenClaw tarball’unu Docker’da global olarak kurar, paketstablekanalından gitdevkanalına geçer, kalıcı kanalın ve Plugin güncelleme sonrası çalışmanın doğruluğunu denetler, ardından paketstablekanalına geri döner ve güncelleme durumunu kontrol eder. - Yükseltme survivor smoke testi:
pnpm test:docker:upgrade-survivor, paketlenmiş OpenClaw tarball’unu agent’lar, kanal yapılandırması, Plugin allowlist’leri, eski Plugin bağımlılık durumu ve mevcut çalışma alanı/oturum dosyaları içeren kirli bir eski-kullanıcı fixture’ının üzerine kurar. Canlı provider veya kanal anahtarları olmadan paket güncellemesi ve etkileşimsiz doctor çalıştırır, ardından bir loopback Gateway başlatır ve yapılandırma/durum korunmasını, başlangıç/durum bütçelerini kontrol eder. - Yayımlanmış yükseltme survivor smoke testi:
pnpm test:docker:published-upgrade-survivorvarsayılan olarakopenclaw@latestkurar, gerçekçi mevcut-kullanıcı dosyalarını seed eder, bu baseline’ı gömülü bir komut tarifiyle yapılandırır, ortaya çıkan yapılandırmayı doğrular, yayımlanmış kurulumu aday tarball’a günceller, etkileşimsiz doctor çalıştırır,.artifacts/upgrade-survivor/summary.jsonyazar, ardından bir loopback Gateway başlatır ve yapılandırılmış intent’leri, durum korunmasını, başlangıcı,/healthz,/readyzve RPC durum bütçelerini kontrol eder. Bir baseline’ıOPENCLAW_UPGRADE_SURVIVOR_BASELINE_SPECile override edin, toplu zamanlayıcıdan[email protected] [email protected] [email protected]gibi tam yerel baseline’larıOPENCLAW_UPGRADE_SURVIVOR_BASELINE_SPECSile genişletmesini isteyin ve issue biçimli fixture’larıreported-issuesgibiOPENCLAW_UPGRADE_SURVIVOR_SCENARIOSile genişletin; reported-issues kümesi otomatik harici OpenClaw Plugin kurulum onarımı içinconfigured-plugin-installsiçerir. Package Acceptance bunlarıpublished_upgrade_survivor_baseline,published_upgrade_survivor_baselinesvepublished_upgrade_survivor_scenariosolarak sunar,last-stable-4veyaall-since-2026.4.23gibi meta baseline token’larını çözer ve Full Release Validation, release-soak paket kapısınılast-stable-4 2026.4.23 2026.5.2 2026.4.15artıreported-issuesolarak genişletir. - Oturum runtime bağlamı smoke testi:
pnpm test:docker:session-runtime-context, gizli runtime bağlamı transcript kalıcılığını ve etkilenen yinelenmiş prompt-rewrite dallarının doctor onarımını doğrular. - Bun global kurulum smoke testi:
bash scripts/e2e/bun-global-install-smoke.sh, mevcut ağacı paketler, izole bir home içindebun install -gile kurar veopenclaw infer image providers --jsonkomutunun takılmak yerine paketle gelen görüntü provider’larını döndürdüğünü doğrular. Önceden oluşturulmuş bir tarball’uOPENCLAW_BUN_GLOBAL_SMOKE_PACKAGE_TGZ=/path/to/openclaw-*.tgzile yeniden kullanın, host derlemesiniOPENCLAW_BUN_GLOBAL_SMOKE_HOST_BUILD=0ile atlayın veyadist/dizinini derlenmiş bir Docker imajındanOPENCLAW_BUN_GLOBAL_SMOKE_DIST_IMAGE=openclaw-dockerfile-smoke:localile kopyalayın. - Installer Docker smoke testi:
bash scripts/test-install-sh-docker.sh, root, update ve direct-npm container’ları arasında tek bir npm cache paylaşır. Update smoke testi, aday tarball’a yükseltmeden önce kararlı baseline olarak varsayılan npmlatestkullanır. YereldeOPENCLAW_INSTALL_SMOKE_UPDATE_BASELINE=2026.4.22ile veya GitHub’da Install Smoke workflow’ununupdate_baseline_versiongirdisiyle override edin. Root olmayan installer kontrolleri, root’a ait cache girdilerinin kullanıcı-yerel kurulum davranışını maskelememesi için izole bir npm cache tutar. Yerel tekrar çalıştırmalarda root/update/direct-npm cache’ini yeniden kullanmak içinOPENCLAW_INSTALL_SMOKE_NPM_CACHE_DIR=/path/to/cacheayarlayın. - Install Smoke CI, yinelenen direct-npm global güncellemeyi
OPENCLAW_INSTALL_SMOKE_SKIP_NPM_GLOBAL=1ile atlar; doğrudannpm install -gkapsamı gerektiğinde betiği bu env olmadan yerelde çalıştırın. - Agents paylaşılan çalışma alanı silme CLI smoke testi:
pnpm test:docker:agents-delete-shared-workspace(betik:scripts/e2e/agents-delete-shared-workspace-docker.sh) varsayılan olarak root Dockerfile imajını derler, izole bir container home içinde tek çalışma alanına sahip iki agent seed eder,agents delete --jsonçalıştırır ve geçerli JSON ile çalışma alanı koruma davranışını doğrular. Install-smoke imajınıOPENCLAW_AGENTS_DELETE_SHARED_WORKSPACE_E2E_IMAGE=openclaw-dockerfile-smoke:local OPENCLAW_AGENTS_DELETE_SHARED_WORKSPACE_E2E_SKIP_BUILD=1ile yeniden kullanın. - Gateway ağ iletişimi (iki container, WS auth + health):
pnpm test:docker:gateway-network(betik:scripts/e2e/gateway-network-docker.sh) - Tarayıcı CDP snapshot smoke testi:
pnpm test:docker:browser-cdp-snapshot(betik:scripts/e2e/browser-cdp-snapshot-docker.sh) kaynak E2E imajını ve bir Chromium katmanını derler, Chromium’u raw CDP ile başlatır,browser doctor --deepçalıştırır ve CDP rol snapshot’larının bağlantı URL’lerini, cursor ile öne çıkarılmış tıklanabilirleri, iframe ref’lerini ve frame metadata’sını kapsadığını doğrular. - OpenAI Responses web_search minimal reasoning regresyonu:
pnpm test:docker:openai-web-search-minimal(betik:scripts/e2e/openai-web-search-minimal-docker.sh) Gateway üzerinden mock’lanmış bir OpenAI sunucusu çalıştırır,web_search’ünreasoning.effortdeğeriniminimal’danlow’a yükselttiğini doğrular, ardından provider şema reddini zorlar ve raw ayrıntının Gateway loglarında göründüğünü kontrol eder. - MCP kanal köprüsü (seed edilmiş Gateway + stdio köprüsü + raw Claude notification-frame smoke testi):
pnpm test:docker:mcp-channels(betik:scripts/e2e/mcp-channels-docker.sh) - Pi bundle MCP araçları (gerçek stdio MCP sunucusu + gömülü Pi profili izin/verme smoke testi):
pnpm test:docker:pi-bundle-mcp-tools(betik:scripts/e2e/pi-bundle-mcp-tools-docker.sh) - Cron/subagent MCP temizliği (gerçek Gateway + izole cron ve tek seferlik subagent çalıştırmalarından sonra stdio MCP child sonlandırma):
pnpm test:docker:cron-mcp-cleanup(betik:scripts/e2e/cron-mcp-cleanup-docker.sh) - Plugin’ler (yerel path,
file:, hoist edilmiş bağımlılıklara sahip npm registry, hareketli git ref’leri, ClawHub kitchen-sink, marketplace güncellemeleri ve Claude-bundle etkinleştirme/inceleme için kurulum/güncelleme smoke testi):pnpm test:docker:plugins(betik:scripts/e2e/plugins-docker.sh) ClawHub bloğunu atlamak içinOPENCLAW_PLUGINS_E2E_CLAWHUB=0ayarlayın veya varsayılan kitchen-sink paket/runtime çiftiniOPENCLAW_PLUGINS_E2E_CLAWHUB_SPECveOPENCLAW_PLUGINS_E2E_CLAWHUB_IDile override edin.OPENCLAW_CLAWHUB_URL/CLAWHUB_URLolmadan test, hermetik bir yerel ClawHub fixture sunucusu kullanır. - Plugin update unchanged smoke testi:
pnpm test:docker:plugin-update(betik:scripts/e2e/plugin-update-unchanged-docker.sh) - Plugin lifecycle matrix smoke testi:
pnpm test:docker:plugin-lifecycle-matrix, paketlenmiş OpenClaw tarball’unu çıplak bir container’a kurar, bir npm Plugin’i kurar, etkinleştir/devre dışı bırak geçişi yapar, yerel bir npm registry üzerinden yükseltir ve düşürür, kurulu kodu siler, ardından her lifecycle aşaması için RSS/CPU metriklerini loglarken kaldırmanın eski durumu hâlâ temizlediğini doğrular. - Config reload metadata smoke testi:
pnpm test:docker:config-reload(betik:scripts/e2e/config-reload-source-docker.sh) - Plugin’ler:
pnpm test:docker:plugins, yerel path,file:, hoist edilmiş bağımlılıklara sahip npm registry, hareketli git ref’leri, ClawHub fixture’ları, marketplace güncellemeleri ve Claude-bundle etkinleştirme/inceleme için kurulum/güncelleme smoke testini kapsar.pnpm test:docker:plugin-update, kurulu Plugin’ler için değişmemiş güncelleme davranışını kapsar.pnpm test:docker:plugin-lifecycle-matrix, kaynak izlenen npm Plugin kurulumunu, etkinleştirmeyi, devre dışı bırakmayı, yükseltmeyi, düşürmeyi ve eksik-kod kaldırmasını kapsar.
Paylaşılan işlevsel imajı elle önceden derlemek ve yeniden kullanmak için:
OPENCLAW_DOCKER_E2E_IMAGE=openclaw-docker-e2e-functional:local pnpm test:docker:e2e-buildOPENCLAW_DOCKER_E2E_IMAGE=openclaw-docker-e2e-functional:local OPENCLAW_SKIP_DOCKER_BUILD=1 pnpm test:docker:mcp-channelsOPENCLAW_GATEWAY_NETWORK_E2E_IMAGE gibi suite’e özgü imaj override’ları ayarlandığında yine önceliklidir. OPENCLAW_SKIP_DOCKER_BUILD=1 uzak bir paylaşılan imajı işaret ettiğinde, betikler imaj zaten yerel değilse onu çeker. QR ve installer Docker testleri kendi Dockerfile’larını korur, çünkü paylaşılan derlenmiş-uygulama runtime’ı yerine paket/kurulum davranışını doğrularlar.
Canlı model Docker çalıştırıcıları ayrıca geçerli checkout'u salt okunur şekilde bind-mount eder ve
container içindeki geçici bir workdir'e hazırlar. Bu, Vitest'i tam olarak yerel kaynak/config'inize
karşı çalıştırırken runtime image'ını ince tutar.
Hazırlama adımı, Docker canlı çalıştırmalarının makineye özel artifact'leri kopyalamak için
dakikalar harcamaması amacıyla .pnpm-store, .worktrees, __openclaw_vitest__ ve app'e yerel .build ya da
Gradle output directory'leri gibi büyük, yalnızca yerel cache'leri ve app build output'larını atlar.
Ayrıca OPENCLAW_SKIP_CHANNELS=1 ayarını yaparlar; böylece Gateway canlı probe'ları container içinde
gerçek Telegram/Discord/vb. channel worker'larını başlatmaz.
test:docker:live-models yine de pnpm test:live çalıştırır; bu nedenle o Docker lane'inde Gateway
canlı kapsamını daraltmanız veya hariç tutmanız gerektiğinde OPENCLAW_LIVE_GATEWAY_* değerlerini de iletin.
test:docker:openwebui daha üst düzey bir uyumluluk smoke testidir: OpenAI uyumlu HTTP endpoint'leri etkinleştirilmiş
bir OpenClaw Gateway container'ı başlatır,
bu Gateway'e karşı pinlenmiş bir Open WebUI container'ı başlatır, Open WebUI üzerinden oturum açar,
/api/models öğesinin openclaw/default sunduğunu doğrular, ardından Open WebUI'nin /api/chat/completions
proxy'si üzerinden gerçek bir chat isteği gönderir.
Canlı model completion'ını beklemeden Open WebUI oturum açma ve model keşfinden sonra durması gereken
release-path CI kontrolleri için OPENWEBUI_SMOKE_MODE=models ayarını yapın.
İlk çalıştırma belirgin şekilde daha yavaş olabilir; çünkü Docker'ın Open WebUI image'ını çekmesi ve
Open WebUI'nin kendi cold-start kurulumunu tamamlaması gerekebilir.
Bu lane kullanılabilir bir canlı model key'i bekler ve Dockerized çalıştırmalarda bunu sağlamanın birincil yolu
OPENCLAW_PROFILE_FILE (~/.profile varsayılan) değeridir.
Başarılı çalıştırmalar { "ok": true, "model": "openclaw/default", ... } gibi küçük bir JSON payload'u yazdırır.
test:docker:mcp-channels özellikle deterministiktir ve gerçek bir Telegram, Discord veya iMessage hesabı gerektirmez.
Seed edilmiş bir Gateway container'ı boot eder, openclaw mcp serve spawn eden ikinci bir container başlatır, ardından
yönlendirilmiş konuşma keşfini, transcript okumalarını, attachment metadata'sını,
canlı event queue davranışını, outbound send routing'i ve gerçek stdio MCP bridge üzerinden Claude tarzı channel +
permission bildirimlerini doğrular. Bildirim kontrolü ham stdio MCP frame'lerini doğrudan inceler; böylece smoke testi
yalnızca belirli bir client SDK'nin yüzeye çıkardığını değil, bridge'in gerçekten ne yaydığını doğrular.
test:docker:pi-bundle-mcp-tools deterministiktir ve canlı model key'i gerektirmez.
Repo Docker image'ını build eder, container içinde gerçek bir stdio MCP probe server'ı başlatır,
bu server'ı gömülü Pi bundle MCP runtime üzerinden materyalize eder, tool'u yürütür, ardından
coding ve messaging'in bundle-mcp tool'larını koruduğunu, minimal ve tools.deny: ["bundle-mcp"] değerlerinin ise bunları filtrelediğini doğrular.
test:docker:cron-mcp-cleanup deterministiktir ve canlı model key'i gerektirmez.
Gerçek bir stdio MCP probe server'ı olan seed edilmiş bir Gateway başlatır, izole bir Cron turn'ü ve
/subagents spawn tek seferlik child turn'ü çalıştırır, ardından MCP child process'inin her çalıştırmadan sonra çıktığını doğrular.
Manuel ACP sade dil thread smoke'u (CI değil):
bun scripts/dev/discord-acp-plain-language-smoke.ts --channel <discord-channel-id> ...- Bu script'i regression/debug workflow'ları için tutun. ACP thread routing doğrulaması için tekrar gerekebilir; bu nedenle silmeyin.
Yararlı env var'lar:
OPENCLAW_CONFIG_DIR=...(varsayılan:~/.openclaw)/home/node/.openclawkonumuna mount edilirOPENCLAW_WORKSPACE_DIR=...(varsayılan:~/.openclaw/workspace)/home/node/.openclaw/workspacekonumuna mount edilirOPENCLAW_PROFILE_FILE=...(varsayılan:~/.profile)/home/node/.profilekonumuna mount edilir ve testleri çalıştırmadan önce source edilirOPENCLAW_DOCKER_PROFILE_ENV_ONLY=1, yalnızcaOPENCLAW_PROFILE_FILEüzerinden source edilen env var'ları doğrulamak için; geçici config/workspace dir'leri kullanır ve harici CLI auth mount'ları kullanmazOPENCLAW_DOCKER_CLI_TOOLS_DIR=...(varsayılan:~/.cache/openclaw/docker-cli-tools) Docker içinde cache'lenmiş CLI install'ları için/home/node/.npm-globalkonumuna mount edilir$HOMEaltındaki harici CLI auth dir/file'ları/host-auth...altında salt okunur mount edilir, ardından testler başlamadan önce/home/node/...içine kopyalanır- Varsayılan dir'ler:
.minimax - Varsayılan file'lar:
~/.codex/auth.json,~/.codex/config.toml,.claude.json,~/.claude/.credentials.json,~/.claude/settings.json,~/.claude/settings.local.json - Daraltılmış provider çalıştırmaları, yalnızca
OPENCLAW_LIVE_PROVIDERS/OPENCLAW_LIVE_GATEWAY_PROVIDERSüzerinden çıkarılan gerekli dir/file'ları mount eder OPENCLAW_DOCKER_AUTH_DIRS=all,OPENCLAW_DOCKER_AUTH_DIRS=noneveyaOPENCLAW_DOCKER_AUTH_DIRS=.claude,.codexgibi virgül listesiyle manuel override edin
- Varsayılan dir'ler:
OPENCLAW_LIVE_GATEWAY_MODELS=.../OPENCLAW_LIVE_MODELS=..., çalıştırmayı daraltmak içinOPENCLAW_LIVE_GATEWAY_PROVIDERS=.../OPENCLAW_LIVE_PROVIDERS=..., container içinde provider'ları filtrelemek içinOPENCLAW_SKIP_DOCKER_BUILD=1, rebuild gerektirmeyen yeniden çalıştırmalar için mevcut biropenclaw:local-liveimage'ını yeniden kullanmak içinOPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, cred'lerin env'den değil profile store'dan geldiğinden emin olmak içinOPENCLAW_OPENWEBUI_MODEL=..., Open WebUI smoke'u için Gateway tarafından sunulan modeli seçmek içinOPENCLAW_OPENWEBUI_PROMPT=..., Open WebUI smoke'u tarafından kullanılan nonce-check prompt'unu override etmek içinOPENWEBUI_IMAGE=..., pinlenmiş Open WebUI image tag'ini override etmek için
Docs doğrulaması
Doc edit'lerinden sonra docs check'lerini çalıştırın: pnpm check:docs.
Sayfa içi heading kontrollerine de ihtiyacınız olduğunda tam Mintlify anchor doğrulamasını çalıştırın: pnpm docs:check-links:anchors.
Çevrimdışı regression (CI-safe)
Bunlar gerçek provider'lar olmadan "gerçek pipeline" regression'larıdır:
- Gateway tool calling (mock OpenAI, gerçek Gateway + agent loop):
src/gateway/gateway.test.ts(case: "runs a mock OpenAI tool call end-to-end via gateway agent loop") - Gateway wizard (WS
wizard.start/wizard.next, config yazar + auth enforced):src/gateway/gateway.test.ts(case: "runs wizard over ws and writes auth token config")
Agent güvenilirlik eval'ları (skills)
Zaten "agent güvenilirlik eval'ları" gibi davranan birkaç CI-safe testimiz var:
- Gerçek Gateway + agent loop üzerinden mock tool-calling (
src/gateway/gateway.test.ts). - Session wiring ve config etkilerini doğrulayan end-to-end wizard flow'ları (
src/gateway/gateway.test.ts).
Skills için hâlâ eksik olanlar (bkz. Skills):
- Karar verme: skills prompt'ta listelendiğinde agent doğru skill'i seçiyor mu (veya ilgisiz olanlardan kaçınıyor mu)?
- Uyumluluk: agent kullanmadan önce
SKILL.mdokuyor ve gerekli adımları/argümanları izliyor mu? - Workflow contract'ları: tool order, session history carryover ve sandbox boundary'lerini assert eden çok turlu scenario'lar.
Gelecekteki eval'lar önce deterministik kalmalıdır:
- Tool call'larını + sırasını, skill file okumalarını ve session wiring'i assert etmek için mock provider'lar kullanan bir scenario runner.
- Skill odaklı küçük bir scenario suite'i (kullanma vs kaçınma, gating, prompt injection).
- Opsiyonel canlı eval'lar (opt-in, env-gated) yalnızca CI-safe suite hazır olduktan sonra.
Contract testleri (plugin ve channel shape)
Contract testleri, kayıtlı her plugin ve channel'ın kendi interface contract'ına uyduğunu doğrular.
Keşfedilen tüm plugin'ler üzerinde iterasyon yapar ve shape ile davranış assertion'larından oluşan bir suite çalıştırır.
Varsayılan pnpm test unit lane'i bu paylaşılan seam ve smoke file'larını bilerek atlar; paylaşılan channel veya provider surface'lerine dokunduğunuzda
contract command'larını açıkça çalıştırın.
Komutlar
- Tüm contract'lar:
pnpm test:contracts - Yalnızca channel contract'ları:
pnpm test:contracts:channels - Yalnızca provider contract'ları:
pnpm test:contracts:plugins
Channel contract'ları
src/channels/plugins/contracts/*.contract.test.ts içinde bulunur:
- plugin - Temel plugin shape'i (id, name, capabilities)
- setup - Setup wizard contract'ı
- session-binding - Session binding davranışı
- outbound-payload - Message payload yapısı
- inbound - Inbound message işleme
- actions - Channel action handler'ları
- threading - Thread ID işleme
- directory - Directory/roster API
- group-policy - Group policy enforcement
Provider status contract'ları
src/plugins/contracts/*.contract.test.ts içinde bulunur.
- status - Channel status probe'ları
- registry - Plugin registry shape'i
Provider contract'ları
src/plugins/contracts/*.contract.test.ts içinde bulunur:
- auth - Auth flow contract'ı
- auth-choice - Auth choice/selection
- catalog - Model catalog API
- discovery - Plugin discovery
- loader - Plugin loading
- runtime - Provider runtime
- shape - Plugin shape/interface
- wizard - Setup wizard
Ne zaman çalıştırılır
- plugin-sdk export'larını veya subpath'lerini değiştirdikten sonra
- Bir channel veya provider plugin ekledikten ya da değiştirdikten sonra
- Plugin registration veya discovery refactor'ından sonra
Contract testleri CI'da çalışır ve gerçek API key'leri gerektirmez.
Regression ekleme (rehberlik)
Canlıda keşfedilen bir provider/model sorununu düzelttiğinizde:
- Mümkünse CI-safe bir regression ekleyin (mock/stub provider veya tam request-shape transformation'ını capture edin)
- Doğası gereği yalnızca canlıysa (rate limit'ler, auth policy'leri), live test'i dar ve env var'larla opt-in tutun
- Bug'ı yakalayan en küçük layer'ı hedeflemeyi tercih edin:
- provider request conversion/replay bug'ı → doğrudan models testi
- gateway session/history/tool pipeline bug'ı → Gateway live smoke veya CI-safe Gateway mock testi
- SecretRef traversal guardrail:
src/secrets/exec-secret-ref-id-parity.test.ts, registry metadata'sından (listSecretTargetRegistryEntries()) her SecretRef class'ı için bir sampled target türetir, ardından traversal-segment exec id'lerinin reddedildiğini assert eder.src/secrets/target-registry-data.tsiçinde yeni birincludeInPlanSecretRef target family eklerseniz, bu testtekiclassifyTargetClassdeğerini güncelleyin. Test, yeni class'ların sessizce atlanamaması için sınıflandırılmamış target id'lerinde bilerek başarısız olur.