CVN-N001-EI-S04 — LightGBM capacity ablation (Block 2) · hub Story¶
Hub documentaire de la Story S04 (diagnostic
s42— statut B, sur-capacité LightGBM). Partie du programme CVN-N001-EI. État live = OpenProject (wp#227, GH #1059, ADR-76).
En une phrase¶
Les défauts HPO de production sur-ajustent-ils par round (AUC train trompeuse) — une config LGB plus douce généraliserait-elle mieux ? (généralise/teste le statut B.)
Les documents¶
| # | Document | Quoi |
|---|---|---|
| 1 | Plan dossier (r3, plan_review PASSED) | objectif, H₀(B), 5 axes (one-at-a-time), envelope + Bonferroni, verdict pré-enregistré _decide_s42 |
| 2 | PR review — committee pr_review PASSED (session 7e699fd2, OP Meeting #239) |
dossier archivé sur la Meeting (pas dans le repo) |
| 3 | MLOps readiness | ADR-70 — monitoring, rollback, DRI |
| 4 | RCA — run hang (2026-06-02) | le full run s'est figé (busy-wait livelock OpenMP/BLAS, confirmé Prometheus) ; root cause + action items |
| 5 | Impact analysis du fix (2026-06-02) | blast-radius du fix ADR-0096 sur modules/infra/libs/process déjà en place |
| 6 | Plan du fix (r2, plan_review PASSED) | caps thread+process env-level (ADR-0096), s42 belt + skip explicite, s43 série, détection A6 ; déploiement phasé WARN→observe→fail-loud |
| 7 | Expérience s42 — defi_top5 fold-3 (2026-06-03) | no-hang validé + verdict 5-axes complet B_SYSTEMATIC_OVERFIT 5/5 (§7). Le run 5-axes a rattrapé ARBUSDC (capacity-OK sur num_leaves → over-fit sur learning_rate, Bonferroni) |
| 8 | Plan deliverable HP swap (validé opérateur) | clôture S04 : dériver la config plus douce recommandée (trajectoire XCom) + valider multi-fold disjoints × f1_buy/Sortino × breakout per-crypto ; lead pas ship (ADR-2/56/59/90) |
| 9 | Rétrospective + lessons learnt (KM) | bilan de clôture : existence≠sélection, AUC≠trading, les 4 §0bis, ce qui a marché, les pièges, les 3 ADR durables. Le négatif scientifique → rendement net positif |
Story antérieure au patron complet (
TEMPLATE_diagnostic_story) : pas d'archi/runbook/test-strategy séparés (impl mergée PR #1095). Le patron complet est appliqué à partir de S05.
État¶
Closed (2026-06-04) — diagnostic s42 mergé + déployé. Premier full run figé (busy-wait livelock — RCA) → fix thread-caps (ADR-0096, PR #1097) mergé 7cea82d + déployé. Re-run 2026-06-03 conclusif (expérience).
- Bug fix thread-caps : CLOS (no-hang prouvé, cap appliqué — tient à l'échelle : 125 fits/cellule × 5, 18 min).
- Diagnostic S04 : COMPLET — run 5-axes complet (2026-06-03,
manual__…08:02) =B_SYSTEMATIC_OVERFIT, 5/5 conclusif (expérience §7). H₀(B) réfuté systématiquement (≠ « statut B confirmé », qui dans le plan =B_CAPACITY_OK, l'opposé) : les défauts HPO prod sur-ajustent. ARBUSDC rattrapé surlearning_rate(Bonferroni).
Deliverable HP swap = RÉSOLU sur un NÉGATIF documenté (2026-06-04) : la reco lr-doux (robuste en val-AUC multi-fold, step-3 A) ne transfère pas à l'objectif trading prod. Vérification observationnelle objectif-confirmée (f1_buy, n=600 trials, range [0.05,0.15]) : la recherche prod ne favorise pas lr bas (médiane 0.106, 0% sous le plancher). Libellé = « pas de support », pas « baisser nuirait ». B inutile (zéro compute). Détail : dossier de revue + §8 résolution (S10). La méthodo (filtrage stabilité asymétrique) = la contribution valide (rapport publié).
Fils ouverts (hors clôture S04) :
- A6 (divergence replay s18_status=FAIL 5/5) → CVN-N001-EI-S09 (GH #1099, wp#237, New).
- Q-range audit (le régime déploiement couvre-t-il les findings fixed-axis s42 ?) sur 8 params LGB + XGB/CB → CVN-N001-EI-S10 (GH #1100, wp#238) suivi.
Gates ADR-81 :
- In testing → Tested : satisfait (verdict pré-enregistré rendu).
- Tested → Closed : satisfait — deliverable HP swap conclu (négatif documenté : non-transfert sous l'objectif trading). S04 CLÔTURÉE (2026-06-04, verdict de gate = négatif/non-transfert enregistré sur OP).
Méthode (commune au programme)¶
Envelope M=maxθ E(θ) bootstrappée + Bonferroni (anti biais de sélection sur les axes), verdicts inconclusifs first-class, no-crash → INCONCLUSIVE_TOOLING. Cf. hub Epic §5.