Araştırma
Olumsuz sonuçlar
Test edilen, 8x90 günlük walk-forward Brier + ECE kriterine karşı değerlendirilen ve yayımlanan topluluğu iyileştirmeyen model varyantları ve özellik eklemeleri. Yayımlama kararı ile yayımlamama kararı aynı kalibrasyon hikayesi olduğu için tam olarak yayımlanmıştır: aşağıdaki her giriş, birinin yazmış olabileceği bir hipotezi, onu değerlendiren testi ve testin neden hayır dediğini kaydeder.
Bütün 23 nottan 11 tanesi yayımlanmamış sonuçtur. Yayımlanan varyantlar dahil tam not dizini şurada: /research/notes/.
Olumsuz sonuçlar neden yayımlanır
- Seçici yayımlama yok. Yalnızca kriteri iyileştiren varyantlar yayımlansaydı, yayımlanan topluluk olduğundan daha kaçınılmaz görünürdü. Olumsuz sonuçlar, yayımlanan her model değişikliğinin etrafındaki negatif uzayın kanıtıdır.
- Kazara yeniden test etmeyi önler. Altı ay önceki başarısız bir ablasyon, yazımı bulunabilir olmadıkça yeni bir çalışma arkadaşı için görünmezdir. Olumsuz sonuçları pozitif olanlarla aynı yüzeyde tutmak, "biri bunu daha önce denedi mi?" sorusunun commit günlüğünü okumayı gerektirmeyen bir yanıtının olmasını sağlar.
- Modelin tavanını belirler. Aynı külliyat üzerinde art arda başarısız olan yoğun kapasite varyantları kendi başına bir ölçümdür: mevcut verilerle kriteri geçmek zordur. Bu sinyal, başarısızlıkları görebilen bir okuyucu için, yalnızca başarıları gören birine kıyasla daha faydalıdır.
- Yayımlanmadı3 June 2026
A within-match chase layer "passes" the headline gate — and the placebo proves it shouldn't
The feasibility probe found that, after controlling for team strength, only
Notu oku →
- Yayımlanmadı29 May 2026
Is composite *coverage* the lever for the player-strength offset? (No)
player-composite's match coverage — whether honestly (point-in-time WC
Notu oku →
- Yayımlanmadı29 May 2026
Does a player-form (momentum) offset improve match forecasts? (No)
player-form differential offset `Δ = α·(form_home − form_away)` does
Notu oku →
- Yayımlanmadı29 May 2026
Can we fit the player-strength coefficient instead of hand-setting it? (No)
α = 0.05 offset (Model 16) beats a per-fold fitted α on median Brier.
Notu oku →
- Yayımlanmadı27 May 2026
Anytime-scorer `start_prob` v2 — predicted-XI layer (default-off)
Model 5 (`scripts/build_anytime_scorer.py`) produces `P(player scores ≥ 1 across the WC tournament)`. The headline depends on `E[minutes]`, which is derived from `start_prob` (the per-match starter likelihood). The v1 chain was:
Notu oku →
- Yayımlanmadı27 May 2026
Do teams try harder in must-win games? (No, actually)
Football economics literature (Brams & Ismail 2018; Apesteguia & Palacios-Huerta 2010 on tournament-incentive distortions) reports that match outcomes in the final round of group-stage tournaments deviate from baseline expectations when the
Notu oku →
- Yayımlanmadı27 May 2026
Letting team ratings drift over time (didn't improve predictions)
Per the design note (variant a, "EMA on (α_t, β_t)"): each team's attack/defence parameters should EVOLVE through time rather than absorb every era's matches into a single stationary compromise. Refit DC at K snapshot timestamps (= the 8 qu
Notu oku →
- Yayımlanmadı24 May 2026
Do some playing styles beat others? (Not enough to measure)
- `scripts/build_style_matchup_training.py` (per-match training join)
Notu oku →
- Yayımlanmadı23 May 2026
Retuning the models for tournament football — what changed
PR #310 documented that all four models in the ensemble are ~7% worse on tournament matches than on the all-matches average. The natural follow-up is to refit the predict-time knobs on a tournament-only training slice and serve tournament-v
Notu oku →
- Yayımlanmadı21 May 2026
Does extra rest between matches help? (Not measurably)
Sports-science literature reports a measurable effect of recovery time on football performance: better-rested teams score slightly more goals than fatigued ones. The expected magnitude is small but consistent across studies (Mohr et al. 201
Notu oku →
- Yayımlanmadı
Can international-tournament StatsBomb signals beat the club-derived baseline?
PR #525 + PR #532 produced two new per-team signals extracted from StatsBomb open event data across WC 2018/2022, Euro 2020/2024, Copa America 2024, AFCON 2023:
Notu oku →