Skip to content

CVN-N001-EI-S04 — LightGBM capacity ablation (Block 2) · hub Story

Hub documentaire de la Story S04 (diagnostic s42statut B, sur-capacité LightGBM). Partie du programme CVN-N001-EI. État live = OpenProject (wp#227, GH #1059, ADR-76).

En une phrase

Les défauts HPO de production sur-ajustent-ils par round (AUC train trompeuse) — une config LGB plus douce généraliserait-elle mieux ? (généralise/teste le statut B.)

Les documents

# Document Quoi
1 Plan dossier (r3, plan_review PASSED) objectif, H₀(B), 5 axes (one-at-a-time), envelope + Bonferroni, verdict pré-enregistré _decide_s42
2 PR review — committee pr_review PASSED (session 7e699fd2, OP Meeting #239) dossier archivé sur la Meeting (pas dans le repo)
3 MLOps readiness ADR-70 — monitoring, rollback, DRI
4 RCA — run hang (2026-06-02) le full run s'est figé (busy-wait livelock OpenMP/BLAS, confirmé Prometheus) ; root cause + action items
5 Impact analysis du fix (2026-06-02) blast-radius du fix ADR-0096 sur modules/infra/libs/process déjà en place
6 Plan du fix (r2, plan_review PASSED) caps thread+process env-level (ADR-0096), s42 belt + skip explicite, s43 série, détection A6 ; déploiement phasé WARN→observe→fail-loud
7 Expérience s42 — defi_top5 fold-3 (2026-06-03) no-hang validé + verdict 5-axes complet B_SYSTEMATIC_OVERFIT 5/5 (§7). Le run 5-axes a rattrapé ARBUSDC (capacity-OK sur num_leaves → over-fit sur learning_rate, Bonferroni)
8 Plan deliverable HP swap (validé opérateur) clôture S04 : dériver la config plus douce recommandée (trajectoire XCom) + valider multi-fold disjoints × f1_buy/Sortino × breakout per-crypto ; lead pas ship (ADR-2/56/59/90)
9 Rétrospective + lessons learnt (KM) bilan de clôture : existence≠sélection, AUC≠trading, les 4 §0bis, ce qui a marché, les pièges, les 3 ADR durables. Le négatif scientifique → rendement net positif

Story antérieure au patron complet (TEMPLATE_diagnostic_story) : pas d'archi/runbook/test-strategy séparés (impl mergée PR #1095). Le patron complet est appliqué à partir de S05.

État

Closed (2026-06-04) — diagnostic s42 mergé + déployé. Premier full run figé (busy-wait livelock — RCA) → fix thread-caps (ADR-0096, PR #1097) mergé 7cea82d + déployé. Re-run 2026-06-03 conclusif (expérience).

  • Bug fix thread-caps : CLOS (no-hang prouvé, cap appliqué — tient à l'échelle : 125 fits/cellule × 5, 18 min).
  • Diagnostic S04 : COMPLET — run 5-axes complet (2026-06-03, manual__…08:02) = B_SYSTEMATIC_OVERFIT, 5/5 conclusif (expérience §7). H₀(B) réfuté systématiquement (≠ « statut B confirmé », qui dans le plan = B_CAPACITY_OK, l'opposé) : les défauts HPO prod sur-ajustent. ARBUSDC rattrapé sur learning_rate (Bonferroni).

Deliverable HP swap = RÉSOLU sur un NÉGATIF documenté (2026-06-04) : la reco lr-doux (robuste en val-AUC multi-fold, step-3 A) ne transfère pas à l'objectif trading prod. Vérification observationnelle objectif-confirmée (f1_buy, n=600 trials, range [0.05,0.15]) : la recherche prod ne favorise pas lr bas (médiane 0.106, 0% sous le plancher). Libellé = « pas de support », pas « baisser nuirait ». B inutile (zéro compute). Détail : dossier de revue + §8 résolution (S10). La méthodo (filtrage stabilité asymétrique) = la contribution valide (rapport publié).

Fils ouverts (hors clôture S04) : - A6 (divergence replay s18_status=FAIL 5/5) → CVN-N001-EI-S09 (GH #1099, wp#237, New). - Q-range audit (le régime déploiement couvre-t-il les findings fixed-axis s42 ?) sur 8 params LGB + XGB/CB → CVN-N001-EI-S10 (GH #1100, wp#238) suivi.

Gates ADR-81 : - In testing → Tested : satisfait (verdict pré-enregistré rendu). - Tested → Closed : satisfait — deliverable HP swap conclu (négatif documenté : non-transfert sous l'objectif trading). S04 CLÔTURÉE (2026-06-04, verdict de gate = négatif/non-transfert enregistré sur OP).

Méthode (commune au programme)

Envelope M=maxθ E(θ) bootstrappée + Bonferroni (anti biais de sélection sur les axes), verdicts inconclusifs first-class, no-crash → INCONCLUSIVE_TOOLING. Cf. hub Epic §5.